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Beschreibuna 



Gegenstand der Erfindung ist ein Verfahren zurfermentativen Herstellung von schwefelhaltigen 
Feinchemikalien, insbesondere L-Methionin, unter Verwendung von Bakterien, in denen einefQr 
5 ein Methylentetrahydrofolat Reduktase (metF)-Gen kodierende Nukleotidsequenzen exprimiert 
wird. 



Stand der Technik 



10 Schwefelhaltige Feinchemikalien, wie zum Beispiel Methionin. Homocystein, S-Adenosyl- 
Methionin, Glutathion, Cystein, Biotin, Thiamin, LiponsSure werden uber natQrliche Stoffwech- 
selprozesse in Zellen hergesteilt und werden in vielen Industriezweigen verwendet, einschliefi- 

• lich der Nahrungsmittel-, Futtermittel-, Kosmetik- und pharmazeutischen Industrie. Diese Sub- 
stanzen, die zusammen ais "schwefelhaltige Feinchemikalien" bezeichnet werden, umfassen 
1 5 organische SSuren, sowohl proteinogene als auch nicht-proteinogene Aminosauren, Vitamine 
und Cofaktoren. Ihre Produktion erfolgt am zweckmaRigsten im GrofJmalJstab mitteis Anzucht 
von Bakterien, die entwickelt wurden, urn gro&e Mengen derjeweils gewunschten Substanzzu 
produzieren und sezernieren. FGr diesen Zweck besonders geeignete Organismen sind coryne- 
forme Bakterien, gram-positive nicht-pathogene Bakterien. 

20 

Es ist bekannt, dass Aminosauren durch Fermentation von Stammen coryneformer Bakterien, 
insbesondere Corynebacterium glutamicum, hergesteilt werden. Wegen dergrolien Bedeutung 
wird standig an der Verbesserung der Hersteliverfahren gearbeitet. Verfahrensverbesserungen 
konnen fermentationstechnische Mafinahmen, wie zum Beispiel ROhrung und Versorgung mit 

• Sauerstoff, oder die Zusammensetzung der Nahrmedien, wie zum Beispiel die Zuckerkonzentra- 
tion wShrend der Fermentation, oder die Aufarbeitung zum Produkt , beispielsweise durch lone- 
naustauschchromatographie, oder die intrinsischen Leistungseigenschaften des Mikroorganis- 
mus selbst betreffen. 



30 Ober Stammselektion sind eine Reihe von Mutantenstammen entwickelt worden, die ein Sorti- 
ment wQnschenswerter Verbindungen aus der Reihe der schwefelhaltigen Feinchemikalien pro- 
duzieren. Zur Verbesserung der Leistungseigenschaften dieser Mikroorganismen hinsichtlich der 
Produktion eines bestimmten MolekOls werden Methoden der Mutagenese, Selektion und Mut- 
antenauswahl angewendet. Dies ist jedoch ein zeitaufwendiges und schwieriges Verfahren. Auf 

35 diese Weise erhalt man z.B. Stamme, die resistent gegen Antimetabolite, wie z. B. die Methio- 
nin-Analoga a-Methyl-Methionin, Ethionin, Norleucin, N-Acetylnorleucin f S- 
Trifluoromethylhomocystein, 2-Amino-5-heprenoitsaure, Seleno-Methionin, Methioninsulfoximin, 
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Methoxin, 1-AminocycIopentan-Carboxylsaure oder auxotroph fQr regulatorisch bedeutsame 
Metabolite sind und schwefelhaltige Feinchemikalien, wie z. B. L-Methionin, produzieren. 

Seiteinigen Jahren werden ebenfalls Methoden der rekombinanten DN A-Technik zur Stamm- 
5 verbesserung von L-Ammosaure produzierender StSmme von Corynebacterium eingesetzt, in- 
dem man einzelne Aminosaure-Biosynthesegene amplifiziert und die Auswirkung auf die Amino- 
saure-Produktion untersucht. 



10 




Kurze Beschreibunq der Erfinduna 

Der Erfindung lag die Aufgabe zugrunde, ein neues Verfahren zur verbesserten fermentativen 
Herstellung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin, bereitzustellen. 

Gelost wird obige Aufgabe durch Bereitstellung eines Verfahrens zur fermentativen Herstellung 
1 5 einer schwefelhaltigen Feinchemikalie, umfassend die Expression einer heterologen Nukleotid- 
sequenz, welche fOr ein Protein mit metF-Aktivitat kodiert, in einem coryneformen Bakterium. 

Ein erster Gegenstand der Erfindung ist Verfahren zur fermentativen Herstellung wenigstens 
einer schwefelhaltigen Feinchemikalie, welches folgende Schritte umfasst: 
20 a) Fermentation einer die gewOnschte schwefelhaltige Feinchemikalie produzierenden co- 
ryneformen Bakterienkultur, wobei in den coryneformen Bakterien zumindest eine hetero- 
loge Nukleotidsequenz exprimiert wird, welche fOr ein Protein mit Methylentetrahydrofolat 
Reduktase (metF)-Aktivitat kodiert; 

b) Anreicherung der schwefelhaltigen Feinchemikalie im Medium oder in den Zellen der 
Bakterien, und 

c) Isolieren der schwefelhaltigen Feinchemikalie, welche vorzugsweise L-Methionin um- 
fasst. 




Vorzugsweise besitzt obige heterologe metF-kodierende Nukleotidsequenz zur metF- 
30 kodierenden Sequenz aus Corynebacterium glutamicum ATCC 1 3032 eine Sequenzhomologie 
von weniger als 100%, wie z.B. mehr als 70%, wie 75, 80, 85, 90 oder 95 %, oder weniger als 
70%, wie z.B. bis zu 60, 50, 40, 30, 20 oder 10 %. Die metF-kodierende Sequenz ist vorzugs- 
weise aus einem der folgenden Organismen von Liste I abgeleitet: 

35 



M/43126 



MetF 



BASF Aktiengesellschaf!^^ 20020289 0000053880 

3 

Liste I 



Organimsus 


Stammsammlung 


Corynebacterium diphteriae 


ATCC 14779 


Streptomyces lividans 


ATCC 19844 


Streptomyces coelicolor 


ATCC 10147 


Aquifex aeolicus 


DSM 6858 


Burkholderia cepacia 


ATCC 25416 


Nitrosomonas europaea 


ATCC 19718 


Pseudomonas aeruginosa 


ATCC 17933 


Xylella fastidiosa 


ATCC 35881 


Pseodomonas fluorescens 


ATCC 13525 


Schizosaccharomyces pombe 


ATCC 24969 


Saccharomyces cerevisiae 


ATCC 10751 


Erwinia carotovora 


ATCC 15713 


Klebsiella pneumoniae 


ATCC 700721 


Salmonella typhi 


ATCC 12839 


Salmonella typhimurium 


ATCC 15277 


Escherichia coli K12 


ATCC55151 


Vibrio cholerae 


ATCC 39315 


Haemophilus influenzae 


ATCC 51907 


Caulobacter crescentus 


ATCC 19089 


Actinobacillus 


ATCC 33384 


actinomycetemcomitans 




Neisseria meningitis 


ATCC 6253 


Rhodobacter capsulatus 


ATCC 11166 


Campylobacter j ej uni 


ATCC 33560 


Lactococcus lactis 


ATCC 7962 


Prochlorococcus marinus 


PCC7118 


Bacillus stearothermophilus 


ATCC 12980 



ATCC: American Type Culture Collection, Rockville, MD, USA 
PCC: Pasteur Culture Collection of Cyanobacteria. Paris Frankreich 
DSM: Deutsche Sammlung von Mikroorganismen und Zellkulturen 

Die erfindungsgemafJ eingesetzte metF-kodierende Sequenz umfasst vorzugsweise eine kodie- 
rende Sequenz gemalJ SEQ ID NO: 1 , 3, 5, 7, 9, 1 1 , 1 3, 1 5, 1 7, 1 9, 21 , 23, 25, 27. 29, 31 , 33, 35, 
37, 39, 41 , 43, 45, 47, 49, 51 und 53 oder eine dazu homologe Nukleotidsequenz, welche furein 
Protein mit metF-Aktivitat kodiert, umfasst 

Die erfindungsgemafJ eingesetzte metF-kodierende Sequenz kodiert aufJerdem vorzugsweise 
fur ein Protein mit metF-Aktivitat, wobei das Protein eine Aminosauresequenz gemSB SEQ ID 
NO:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 
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und 54 oder eine dazu homologe Aminosauresequenz, welche fur ein Protein mit metF-Aktivitat 
steht, umfasst. 

Die kodierende metF-Sequenz ist vorzugsweise eine in coryneformen Bakterien replizierbare 
oder eine stabil in das Chromosom intregrierte DNA oder eine RNA. 

Gemaft einer bevorzugten AusfOhrungsform wird das erfindungsgemaRe Verfahren durchge- 
fuhrt, indem man 

a) einen mit einem Plasmidvektor transformierten Bakterienstamm einsetzt der wenigstens 
eine Kopie der kodierenden metF-Sequenz unter der Kontrolle regulativer Sequenzen tragt, oder 

b) einen Stamm einsetzt, in dem die kodierende metF-Sequenz in das Chromosom des 
Bakteriums integriert wurde. 

Es ist weiterhin bevorzugt, die kodierende metF-Sequenz fur die Fermentation zu Qberexprimie- 
ren. 

Aulierdem kann es wOnschenswert sein, Bakterien zu fermentieren, in denen zusatzlich wenigs- 
tens ein weiteres Gen des Biosyntheseweges der gewunschten schwefelhaltigen Feinchemikalie 
verstarkt ist; und / oder 

in denen wenigstens ein Stoffwechselweg zumindest teilweise ausgeschaltet sind, der die Bil- 
dung der gewOnschten schwefelhaltigen Feinchemikalie vernngert. 

Aulierdem kann es wOnschenswert sein, Bakterien zu fermentieren, in denen zusatzlich wenigs- 
tens ein weiteres Gen des Biosyntheseweges der gewQnschten schwefelhaltigen Feinchemikalie 
durch Stoflwechselmetabolite in seiner Aktivitat nicht in unerwOnschterWeise beeinflusstwird. 

Gemali einer weiteren AusfOhrungsform des erfindungsgemaflen Verfahrens werden deshalb 
coryneforme Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt 
unter 

a) dem fOr eine Aspartatkinase kodierenden Gen lysC, 

b) dem fur eine Aspartat-Semialdehyd-Dehydrogenase kodierenden Gen asd 

c) dem fOr die Glycerinaldehyd-3-Phosphat Dehydrogenase kodierenden Gen gap, 

d) dem fOr die 3-Phosphoglycerat Kinase kodierenden Gen pgk, 

e) dem fur die Pyruvat Carboxylase kodierenden Gen pyc, 

f) dem fOr die Triosephosphat Isomerase kodierenden Gen tpi, 
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g) 

h) 
i) 

j) 

k) 

I) 

m) 
n) 
o) 



dem ftir die Homoserin O-Acetyitransferase kodierenden Gen metA, 
dem fOr die Cystahionin-gamma-Synthase kodierenden Gen metB, 
dem fQr die Cystahionin-gamma-Lyase kodierenden Gen metC, 
dem fQr die Serin-Hydroxymethyltransferase kodierenden Gen glyA, 
dem fQr die O-Acetylhomoserin-Sulfhydrylase kodierenden Gen metY, 
dem fOrdie Methionin Synthase kodierenden Gen metH, 
dem fOr die Phosphoserin-Aminotransferase kodieren Gen serC 
dem fQr die Phosphoserin-Phosphatase kodieren Gen serB, 
dem fur die Serine Acetyl-Transferase kodieren Gen cysE, 



p) dem fOr die Homoserin-Dehydrogenase kodieren Gen horn, 
Qberexprimiert ist. 

Gemafi einer anderen AusfQhrungsform des erfindungsgemalien Verfahrens werden corynefor- 
me Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene ausgewahlt unter 
Genen der oben genannten Gruppe a) bis p) mutiert ist, so dass die korrespondierenden Protei- 
ne, verglichen mit nicht mutierten Proteinen, in geringerem Malie oder nicht durch Stoffwech- 
selmetabolite in ihrer Aktivitat beeinflusst werden und dass insbesonderedie erfindungsgemafie 
Produktion der Feinchemikalie nicht beeintrachtigt wird. 

Gemafi einer anderen AusfQhrungsform des erfindungsgemalien Verfahrens werden corynef<?r- 
me Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt unter 
q) dem fQr die Homoserine-Kinase kodierenden Gen thrB, 
r) dem fQr die Threonin Dehydratase kodierenden Gen ilvA, 
s) dem fQr die Threonin Synthase kodierenden Gen thrC 
t) dem fur die Meso-Diaminopimelat D-Dehydrogenase kodierenden Gen ddh 
u) dem fQr die Phosphoenolpyruvat-Carboxykinase kodierenden Gen pck, 
v) dem fQr die Glucose-6-Phosphat-6-lsomerase kodierenden Gen pgi, 
w) dem fur die Pyruvat-Oxidase kodierenden Gen poxB, 
x) dem fQr die Dihydrodipicolinat Synthase kodiernden Gen dapA, 
y) dem fur die Dihydrodipicolinat Reduktase kodiernden Gen dapB; oder 
z) dem fQr die Diaminopicolinat Decarboxylase kodiernden Gen lysA 
abschwacht ist, insbesondere durch Verringerung der Expressionsrate des korrespondierenden 



Gemafi einer anderen AusfQhrungsform des erfindungsgemafien Verfahrens werden corynefor- 
me Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene derobigen Gruppen 



Gens. 
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q) bis z) mutiert ist, so dass die enzymatische Aktivitat des korrespondierenden Proteins teilwei- 
se Oder vollstandig verringert wird. 

Vorzugsweise werden in dem erfindungsgemalien Verfahren Mikroorganismen der ArtCoryne- 
bacterium glutamicum eingesetzt. 

Ein weiterer Gegenstand der Erfindung betrifft ein Verfahren zur Herstellung eines L-Methionin- 
haltigen Tierfuttermittel-Additivs aus FermentationsbrQhen, welches folgende Schritte umfasst 

a) Kultivierung und Fermentation eines L-Methionin produzierenden Mikroorganis- 
mus in einem Fermentationsmedium; 

b) Entfemung von Wasser aus der L-Methionin haltigen FermentationsbrOhe; 

c) Entfernung der wahrend der Fermentation gebildeten Biomasse in einer Menge 
von 0 bis 100 Gew.-%; und 

d) Trocknung der gemali b) und/oder c) erhaltenen FermentationsbrOhe, urn das 
Tierfuttermittel-Additiv in der gewOnschten Puiver- oder Granulatform zu erhalten. 

Gegenstand der Erfindung sind ebenfalls die erstmalig aus obigen Mikroorganismen isolierten 
kodierenden metF-Sequenzen, diedavon kodierten metF-Enzyme sowie diefunktionalen Homo- 
logen dieser Polynukleotide bzw. Proteine. 

Detaillierte Beschreibunq der Erfindung 

a) Allgemeine Begriffe 

Als Proteine mit der Aktivitat der Methylentetrahydrofolat-Reduktase werden solche Proteine 
beschrieben, die in der Lage sind 5,10-Methylenetetrahydrofolat (CH 2 -H(4)Folat) unter Oxi- 
dation des Cofaktors NADH oder NADPH zu 5-Methyltetrahydrofolat (CH 3 -H(4)Folat) zu re- 
duzieren. 

Dem Fachmann sind weitere Details des metF Proteins bekannt: (Matthews RG. Sheppard C. 
Goulding C. European Journal of Pediatrics. 157 Suppl 2:S54-9, 1998, Trimmer EE. Ballou DP. 
Matthews RG. Biochemistry. 40(21 ):6205-1 5, 2001 ). Der Fachmann kann die enzymatische Akti- 
vivtat von metF durch Enzymtests nachweisen, Vorschriften dafiirkdnnen sein: Matthews, R.G., 
Methylenetetrahydrofolate reductase from pig liver. Methods in Enzymology. 122:372-81 , 1986. 

Im Rahmen der vorliegenden Erfindung umfasst der Begriff „schwefelhaltige Feinchemikalie" 
jegliche chemische Verbindung, die wenigstens ein Schwefelatom kovalent gebunden enthalt 
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und durch ein erfindungsgemades Fermentationsverfahrens zuganglich ist. Nichtlimitierende 
Beispiele dafOr sind Methionin, Homocystein, S-Adenosyl-Methionin, insbesondere Methionin, 
und S-Adenosyl-Methionin. 

Im Rahmen der vorliegenden Erfindung umfassen die Begriffe „L-Methionin M , JVIethionin", Ho- 
mocystein und S-Adenosylmethionin auch die korrespondierenden Salze, wie z. B. Methionin- 
Hydrochlorid oder Methionin-Sulfat. 

"Polynukleotide" bezeichnet im allgemeinen Polyribonukleotide (RNA) und Polydeoxyribonukleo- 
tide (DNA), wobei es sich urn nicht modifizierte RNA oder DNA oder modifizierte RNA Oder DNA 
handeln kann. 

Unter "Polypeptide^' versteht man erfindungsgemaft Peptide oder Proteine, die zwei oder mehr 
Qber Peptidbindungen verbundene Aminosauren enthalten. 

Der Begriff ^Stoffwechselmetabolif bezeichnet chemische Verbindungen, die im Stoffwechsel 
von Organismen als Zwischen- oder auch Endprodukte vorkommen und die neben ihrer Eigen- 
schaft als chemische Bausteine auch modulierende Wirkung auf Enzyme und ihre katalytische 
Aktivitat haben konnen. Dabei ist aus der Literatur bekannt, dass solche Stoffwechselmetabolite 
sowohl hemmend als auch stimulierend auf die Aktvitat von Enzymen wirken konnen (Bioche- 
mistry, Stryer, Lubert, 1995 W. H. Freeman & Company, New York, New York.). In der Literatur 
ist auch beschrieben, dass es moglich ist durch MafJnahmen wie Mutation der genomischen 
DNA durch UV-Strahlung, ionisierender Strahlung oder mutagene Substanzen und naqhfolgen- 
der Selektion auf bestimmte Phanotypen in Organismen solche Enzyme zu produzieren, in de- 
nen die Beeinflussung durch Stoffwechselmetabolite verandert wurde (Sahm H. Eggeling L. de 
Graaf AA. Biological Chemistry 381(9-10):899-9l(), 2000; Eikmanns BJ. Eggeling L. Sahm H. 
Antonie van Leeuwenhoek. 64:145-63, 1993-94). Diese veranderten Eigenschaften kfinnen auch 
durch gezielte MafJnahmen erreicht werden. Dabei istdem Fachmann bekannt, dass in Gene fur 
Enzyme auch gezielt bestimmte Nukleotide derfQrdas Protein kodierenden DNA so zu veran- 
dern, dass das aus der exprimierten DNA-Sequenz resultierende Protein bestimmte neue Ei- 
genschaften aufweist, so zum Beispiel, dass die modulierende Wirkung von Stoffwechselmeta- 
boliten gegenQber dem nicht verSnderten Protein verandert ist 

Enzyme konnen derart in ihrer Aktivitat beeinfluftt werden, dass es zu einer Verringerung der 
Reaktionsgeschwindigkeit, oderzu einer Veranderung der Affinitat gegenuberdem Substrato- 
der zu einer Anderung der Reaktionsgeschwindigkeiten. 
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Die Begriffe "exprimieren" bzw. "Verstarkung" oder n 0berexpnession a beschneiben im Kontext der 
Erfindung die Produktion bzw. ErhShung der intrazellularen Aktivitat eines oder mehrerer Enzy- 
me in einem Mikroorganismus, die durch die entsprechende DNA kodiert werden. Dazu kann 
man beispielsweise ein Gen in einen Organismus einbringen, ein vorhandenes Gen durch ein 
anderes Gen ersetzen, die Kopienzahl des Gens bzw. der Gene erhohen, einen starken Promo- 
tor verwenden oder ein Gen verwenden, das fur ein entsprechendes Enzym mit einer hohen 
Aktivitat kodiert und man kann gegebenenfalls diese Mafinahmen kombinieren. 

b) ErfindungsgemaBe metF-Proteine 

ErfindungsgemafJ mit umfasst sind ebenfalis „funktionale Aquivalente" der konkret offenbarten 
metF-Enzyme aus Organismen obiger Liste I. 

..Funktionale Aquivalente" oder Analoga der konkret offenbarten Polypeptide sind im Rahmen 
1 5 der vorliegenden Erfindung davon verschiedene Polypeptide, welche weiterhin die gewQnschte 
biologische Aktivitat, wie z.B. Substratspezifitat, besitzen. 

Unter "funktionalen Aquivalenten" versteht man erfindungsgemafi insbesondere Mutanten, wel- 
che in wenigstens einer der oben genannten Sequenzpositionen eine andere als die konkret 
20 genannte Aminosaure aufweisen aber trotzdem eine der oben genannten biologische Aktivitat 
besitzen. "Funktionale Aquivalente" umfassen somit die durch eine oder mehrere Aminosaure- 
Additionen, -Substitutionen, -Deletionen und/oder -Inversionen erhaltlichen Mutanten, wobei die 
genannten Veranderungen in jeglicher Sequenzposition auftreten konnen, solange sie zu einer 
Mutante mitdem erfindungsgemalJen Eigenschaftsprofilfuhren. Funktionale Aquivalenzist ins- 
besondere auch dann gegeben, wenn die Reaktivitatsmusterzwischen Mutante und unverander- 
tem Polypeptid qualitativ ubereinstimmen, d.h. beispielsweise gleiche Substrate mit unterschied- 
licher Geschwindigkeit umgesetzt werden. 

"Funktionale Aquivalente" umfassen natQrlich auch Polypeptide welche aus anderen Organis- 
30 men zuganglich sind, sowie naturlich vorkommende Varianten. Beispielsweise lassen sich durch 
Sequenzvergleich Bereiche homologer Sequenzregionen festlegen und in Anlehnung an die 
konkreten Vorgaben der Erfindung aquivalente Enzyme ermitteln. 

„Funktionale Aquivalente" umfassen ebenfalis Fragmente, vorzugsweise einzelne Domanen o- 
35 der Sequenzmotive, der erfindungsgemafien Polypeptide, welche z.B. die gewunschte biologi- 
sche Funktion aufweisen. 
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„Funktionale Aquivalente" sind aufterdem Fusionsproteine, welche ein der oben genannten Po- 
lypeptidsequenzen oder davon abgeleitete funktionale Aquivalente und wenigstens eine weitere, 
davon funktionell verschiedene, heterologe Sequenz in funktioneller N- oder C-terminaier Ver- 
knQpfung (d.h. ohne gegenseitigen wesentliche funktionelie Beeintrachtigung der Fusionsprote- 
inteile) aufweisen. Nichtlimitiernde Beispiele fQr derartige heterologe Sequenzen sind z.B. Sig- 
nalpeptide, Enzyme, Immunoglobuline, Oberflachenantigene, Rezeptoren oder Rezeptorligan- 
den. 

ErfindungsgemafJ mit umfasste „funktionale Aquivalente" sind Homologe zu den konkret offen- 
barten Proteinen. Diese besitzen wenigstens 30%, oder etwa 40%, 50 %, vorzugsweise wenigs- 
tens etwa 60 %, 65%, 70%, oder 75% ins besondere wenigsten 85 %, wie z.B. 90%, 95% oder 
99%, Homologie zu einer der konkret offenbarten Sequenzen, berechnet nach dem Algorithmus 
von Pearson und Lipman, Proc. Natl. Acad, Sci. (USA) 85(8), 1988, 2444-2448. 

Homologe der erfindungsgemalien Proteine oder Polypeptide konnen durch Mutagenese er- 
zeugtwerden, z.B. durch Punktmutation oderVerkQrzung des Proteins. Der Begriff "Homolog", 
wie er hier verwendet wird, betrifft eine variante Form des Proteins, die als Agonist o- 
der Antagonist der Protein-Aktivitat wirkt. 

Homologe des erfindungsgemafien Proteine konnen durch Screening kombinatorischer Banken 
von Mutanten, wie z.B. VerkOrzungsmutanten, identifiziert werden. Beispielsweise kann eine 
variegierte Bank von Protein-Varianten durch kombinatorische Mutagenese auf Nukleinsaure- 
ebene erzeugt werden, wie z.B. durch enzymatisches Ligieren eines Gemisches synthetischer 
Oligonukleotide. Es gibt eine Vielzahl von Verfahren, die zur Herstellung von Banken potentieller 
Homologer aus einer degenerierten Oligonukleotidsequenz verwendet werden konnen. Die 
chemische Synthese einer degenerierten Gensequenz kann ineinem DNA-Syntheseautomaten 
durchgefQhrt werden, und das synthetische Gen kann dann in einen geeigneten Expressions- 
vektor ligiert werden. Die Verwendung eines degenerierten Gensatzes ermoglicht die Bereitstel- 
lung samtlicher Sequenzen in einem Gemisch, die den gewOnschten Satzan potentiellen Prote- 
insequenzen codieren. Verfahren zur Synthese degenerierter Oligonukleotide sind dem Fach- 
mann bekannt (Z.B. Narang, S.A. (1983) Tetrahedron 39:3; Itakuraetal. (1984) Annu. Rev. Bio- 
chem. 53:323; Itakura et al., (1984) Science 198:1056; Ike et ah (1983) Nucleic Acids Res. 
11:477). 

Zusatzlich konnen Banken von Fragmenten des Protein-Codons verwendet werden, urn eine 
variegierte Population von Protein-Fragmenten zum Screening und zuranschlielienden Selekti- 
on von Homologen eines erfindungsgemafien Proteins zu erzeugen. Bei einer AusfOhrungsform 
kann eine Bank von kodierenden Sequenzfragmenten durch Behandeln eines doppelstrangigen 
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PCR-Fragmentes einer kodierenden Sequenz mit einer Nuklease unter Bedingungen, unter de- 
nen ein Nicking nuretwa einmal pro MolekOI erfolgt, Denaturieren der doppelstrSngigen DNA, 
Renaturieren der DNA unter Bildung doppelstrangiger DNA, die Sense-/Antisense-Paare von 
verschiedenen genickten Produkten umfassen kann, Entfernen einzelstrangigerAbschnitteaus 
5 neu gebildeten Duplices durch Behandlung mit S1 -Nuclease und Ligieren der resultierenden 
Fragmentbank in einen Expressionsvektor erzeugt werden. Durch dieses Verfahren kann eine 
Expressionsbank hergeleitet werden, die N-terminaie, C-termina!e und interne Fragmente mit 
verschiedenen GrofSen des erfidungsgemafJen Proteins kodiert. 

10 Im Stand der Technik sind mehrere Techniken zum Screening von Genprodukten kombinatori- 
scher Banken, die durch Punktmutationen oder Verkurzung hergestellt worden sind, und zum 

• Screening von cDNA-Banken auf Genprodukte mit einer ausgewahlten Eigenschaft bekannt. 
Diese Techniken lassen sich an das schnelle Screening der Genbanken anpassen, die durch 
kombinatorische Mutagenese von erfindungsgemafler Homologer erzeugt worden sind. Die am 
15 haufigsten verwendeten Techniken zum Screening grolier Genbanken, die einer Analyse mit 
hohem Durchsatz unterliegen, umfassen das Klonieren der Genbank in replizierbare Expressi- 
onsvektoren, Transformieren der geeigneten Zellen mit der resultierenden Vektorenbank und 
Exprimieren der kombinatorischen Gene unter Bedingungen, unter denen der Nachweis der ge- 
wunschten Aktivitat die Isolation des Vektors, der das Gen codiert, dessen Produkt nachgewie- 
20 sen wurde, erleichtert. Recursive-Ensemble-Mutagenese (REM), eine Technik, die die Haufigkeit 
funktioneller Mutanten in den Banken vergrofiert, kann in Kombination mit den Screeningtests 
verwendet werden, um Homologe zu identifizieren (Arkin und Yourvan (1992) PNAS 89:781 1- 
7815; Delgrave et al. (1993) Protein Engineering 6(3):327-331 

c) Erfindunqsgemafte Polvnukleotide 

Gegenstand der Erfindung sind ebenso Nukleinsauresequenzen (einzel- und doppelstrangige 
DNA- und RNA-Sequenzen, wie z.B. cDNA und mRNA), kodierend fOr eines der obigen metF- 
Enzyme und deren funktionalen Aquivalenten, welche z.B. auch unter Verwendung kunstlicher 
30 Nukleotidanaloga zuganglich sind. 

Die Erfindung betrifftsowohl isolierte Nukleinsauremolekule, welche fur erfindungsgemade Po- 
lypeptide bzw. Proteine oder biologisch aktive Abschnitte davon kodieren, sowie Nukleinsaure- 
fragmente, die z.B. zur Verwendung als Hybridisierungssonden oder Primer zur Identifizierung 
35 oder Amplifizierung von erfindungsgema&er kodierenden Nukleinsauren venA/endet werden kon- 
nen. 
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Die erfindungsgemaften Nukleinsauremolekule konnen zudem untranslatierte Sequenzen vom 
3'- und/oder 5 -Ende des kodierenden Genbereichs enthalten 

Ein "isoliertes" NukleinsauremolekGI wird von anderen NukleinsauremolekQIen abgetrennt, die in 
5 der natOrlichen Quelle der Nukleinsaure zugegen sind und kann uberdies im wesentlichen frei 
von anderem zellularen Material oder Kulturmedium sein, wenn es durch rekombinante Techni- 
ken hergestellt wird, oder frei von chemischen Vorstufen oder anderen Chemikalien sein, wenn 
es chemisch synthetisiert wird. 

Die Erfindung umfasst weiterhin die zu den konkret beschriebenen Nukleotidsequenzen kom- 
plementaren Nukleinsauremolekule oder einen Abschnitt davon. 

Die erfindungsgemafj Nukleotidsequenzen ermOglichen die Erzeugung von Sonden und Pri- 
mern, die zur Identifizierung und/oder Klonierung von homologer Sequenzen in anderen Zellty- 
pen und Organismen verwendbarsind. Solche Sonden bzw. Primer umfassen gewohnlich einen 
Nukleotidsequenzbereich, der unter stringenten Bedingungen an mindestens etwa 12, vorzugs- 
weise mindestens etwa 25, wie z.B. etwa 40, 50 oder 75 aufeinanderfolgende Nukleotide eines 
Sense-Stranges einer erfindungsgemaften Nukleinsauresequenz oder eines entsprechenden 
Antisense-Stranges hybridisiert. 

Weitere erfindungsgemalie Nukleinsauresequenzen sind abgeleitet von SEQ ID NO:1, 3, 5, 7, 9, 
11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39,41,43,45, 47, 49, 51 oder 53 und un- 
terscheiden sich davon durch Addition, Substitution, Insertion oder Deletion einzelnerodermeh- 
rerer Nukleotide, kodieren aber weiterhin fOr Polypeptide mitdem gewunschten Eigenschaftspro- 
fll. Dies konnen Polynukleotide sein, die zu obigen Sequenzen in mindestens etwa 50%, 55%, 
60%, 65%, 70%, 80% oder 90%, vorzugsweise in mindestens etwa 95%, 96%, 97%, 98% oder 
99% der Sequenzpositionen identisch sind. 

Erfindungsgemali umfasst sind auch solche Nukleinsauresequenzen, die sogenannte stumme 
30 Mutationen umfassen oder entsprechend der Codon-Nutzung eins speziellen Ursprungs- oder 
Wirtsorganismus, im Vergleich zu einer konkret genannten Sequenzverandertsind, ebenso wie 
natOrlich vorkommende Varianten, wie z.B. Spleilivarianten oder Allelvarianten, davon. Gegens- 
tand sind ebenso durch konservative Nukleotidsubstutionen (d.h. die betreffende Aminosaure 
wird durch eine Aminosaure gleicher Ladung, Grofie, Polaritat und/oder Loslichkeit ersetzt) er- 
35 haltliche Sequenzen. 
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Gegenstand der Erfindung sind auch die durch Sequenzpolymorphismen von den konkret offen- 
barten Nukleinsauren abgeleiteten Molekule. Diese genetischen Polymorphismen kannen zwi- 
schen Individuen innerhalb einer Population aufgrund der natQrlichen Variation existieren. Diese 
natGrlichen Variationen bewirken Oblicherweise eine Varianz von 1 bis 5 % in der Nukleotidse- 
quenz eines Gens. 

Weiterhin umfasst die Erfindung auch Nukleins§uresequenzen, welchen mit oben genannten 
kodierenden Sequenzen hybridisieren oder dazu komplementarsind. Diese Poiynukleotide las- 
sen sich bei Durchmusterung von genomischen oder cDNA-Banken auffinden und gegebenen- 
falls daraus mit geeigneten Primern mittels PCR vermehren und anschlielSend beispielsweise 
mit geeigneten Sonden isolieren. Eine weitere Moglichkeit bietet die Transformation geeigneter 
Mikroorganismen mit erfindungsgemalien Polynukleotiden oder Vektoren, die Vermehrung der 
Mikroorganismen und damit der Poiynukleotide und deren anschliefiende Isolierung. Daruber 
hinaus konnen erfindungsgemafte Poiynukleotide auch auf chemischem Wege synthetisiert 
werden. 

Unter der Eigenschaft, an Poiynukleotide „hybridisieren tt zu konnen, versteht man die Fahigkeit 
eines Poly- oder Oligonukleotids unter stringenten Bedingungen an eine nahezu komplementare 
Sequenz zu binden, wahrend unter diesen Bedingungen unspezifische Bindungen zwischen 
nicht-komplementaren Partnern unterbleiben. Dazu sollten die Sequenzen zu 70-100%, vor- 
zugsweise zu 90-100%, komplementar sein. Die Eigenschaft komplementarer Sequenzen, spe- 
zifisch aneinander binden zu konnen, macht man sich beispielsweise in der Northern- oder Sou- 
thern-Blot-Technik oder bei der Primerbindung in PCR oder RT-PCR zunutze. Oblicherweise 
werden dazu Oiigonukleotide ab einer Lange von 30 Basenpaaren eingesetzt. Unter stringenten 
Bedingungen versteht man beispielsweise in der Northern-Blot-Technik die Verwendung einer 
50 - 70 °C, vorzugsweise 60 - 65 °C warmen Waschlosung, beispielsweise 0,1x SSC-Puffer mit 
0,1% SDS (20x SSC: 3M NaCI, 0.3M Na-Citrat, pH 7,0) zur Elution unspezifisch hybridisierter 
cDNA-Sonden oder Oiigonukleotide. Dabei bleiben, wie oben erwahnt, nur in hohem Mafie 
komplementare Nukleinsauren aneinander gebunden. Die Einstellung stringenter Bedingungen 
istdem Fachmann bekanntund istz:B. in Ausubel etal., Current Protocols in Molecular Biology, 
John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6. beschrieben. 

c) Isolierung der kodierenden metF-Gene 

Die fur das Enzym Methylentetrahydrofolat Reduktase kodierenden metF-Gene aus den Orga- 
nismen obiger Liste I sind in an sich bekannter Weise isolierbar. 
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Zur Isolierung der metF-Gene oder auch anderer Gene der Organismen aus obiger Liste I wird 
zunachsteine Genbank dieses Organsimus in Escherichia coli (E. coli) angelegt Das Anlegen 
von Genbanken ist in allgemein bekannten LehrbOchem und Handbuchern ausfuhrlich beschrie- 
ben. Als Beispiel seien das Lehrbuch von Winnacker Gene und Klone, Eine Einfuhrung in die 
5 Gentechnologie (Verlag Chemie, Weinheim, Deutschland, 1990), oder das Handbuch von 
Sambrook et al.: Molecular Cloning, A Laboratory Manual (Cold Spring Harbor Laboratory Press, 
1989) genannt. Eine sehr bekannte Genbank ist die des E. coli K-12 StammesW31 10, die von 
Kohara et al. (Cell50, 495-508 (198)) in X-Vektoren angelegt wurde. 

1 0 Zur Herstellung einer Genbank von Organismen der Liste I in E. coli konnen Cosmide, wie der 
Cosmidvektor SuperCos I (Wahl etal., 1987, Proceedings of the National Academy of Sciences 

• USA, 84: 2160-2164), aber auch Plasmide, wie pBR322 (BoliVal; Life Sciences, 25, 807-818 
(1 979)) oder pUC9 (Vieira et al., 1 982, Gene, 1 9: 259-268), verwendet werden. Als Wirte eignen 
sich besonders solche E. coli Stamme, die restriktions- und rekombinationsdefektsind. Ein Bei- 
1 5 spiel hierfOr ist der Stamm DH5amcr, der von Grant et al. (Proceedings of the National Academy 
of Sciences USA, 87 (1 990) 4645-4649) beschrieben wurde. Die mit Hilfe von Cosmiden klonier- 
ten langen DNA-Fragmente kQnnen anschlieftend wiederum in gangige, fOrdie Sequenzierung 
geeignete Vektoren subkloniert und anschlieliend sequenziert werden, so wie es z. B. bei San- 
ger etal. (proceedings of the National Academy of Sciences of the United States of America. 74: 
20 5463-5467, 1977) beschrieben ist. 

Die erhaltenen DNA-Sequenzen konnen dann mit bekannten Algorithmen bzw. Seqiienzanalyse- 
Programmen, wie z. B. dem von Staden (Nucleic Acids Research 14,217-232(1986)), dem von 

• Marck (Nucleic Acids Research 16, 1829-1836 (1988)) oder dem GCG-Programm von Butler 
(Methods ofBiochemical Analysis 39, 74-97 (1998)), untersucht werden. 

Die fur die metF-Gene kodierenden DNA-Sequenzen von Organismen gemaft obiger Liste I 
wurde gefunden. Insbesondere wurden DNA-Sequenzen gemafS gemaft SEQ ID NO:1, 3, 5, 7, 

9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51 und 53. Wei- 
30 terhin wurde aus diesen vorliegenden DNA-Sequenzen mit den oben beschriebenen Methoden 

die Aminosauresequenzen der entsprechenden Proteine abgeleitet. Durch SEQ ID NO:2, 4, 6, 8, 

10. 12, 14, 16, 18. 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 und 54 sind 
die sich ergebenden Aminosauresequenzen der metF-Genprodukte dargestellt. 

35 Kodierende DNA-Sequenzen, die sich aus den Sequenzen gemali SEQ ID NO:1 , 3, 5, 7, 9, 1 1 , 
13, 15, 17, 1 9, 21 , 23, 25, 27, 29, 31 , 33, 35, 37, 39, 41 , 43, 45, 47, 49, 51 und 53 durch die De- 
generation des genetischen Kodes ergeben, sind ebenfalls Gegenstand der Erfindung. In glei- 
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cherWeise sind DNA-Sequenzen, die mitdiesen Sequenzen oderdavon abgeleiteten Sequenz- 
teilen hybridisieren, Gegenstand der Erfindung. 

Anleitungen zur Identifizierung von DNA-Sequenzen mittels HybridisierungfindetderFachmann 
unter anderem im Handbuch "The DIG System Users Guide filr Filter Hybridization" der Firma 
Boehringer Mannheim GmbH (Mannheim, Deutschland, 1993) und bei Liebletal. (International 
Journal of Systematic Bacteriology (1 991 ) 41 : 255-260). Anleitungen zur Amplifikation von DNA- 
Sequenzen mit Hilfe der Polymerase-Kettenreaktion (PCR)findetder Fachmann unter anderem 
im Handbuch von Gait: Oligonukleotide synthesis: A Practical Approach (IRL Press, Ox- ford, 
UK, 1984) und bei Newton und Graham: PCR (Spektrum Akademischer Verlag, Heidelberg, 
Deutschland, 1994). 

Weiterhin ist bekannt, dass Anderungen am N- und/oder C- Terminus eines Proteins dessen 
Funktion nicht wesentlich beeintrachtigen oder sogar stabilisieren k6nnen. Angaben hierzu findet 
der Fachmann unter anderem bei Ben-Bassat et al. (Journal of Bacteriology 169: 751-757 
(1987)), bei O'Regan etal. (Gene 77: 237-251 (1989), bei Sahin-Toth etal. (Protein Sciences 3: 
240-247 (1994)), bei Hochuli et al. (Biontechnology 6: 1321-1325 (1988)) und in bekannten 
LehrbQchem der Genetik und Molekularbiologie. 

Aminosauresequenzen, die sich in entsprechender Weise aus den SEQ ID NO:2, 4, 6, 8, 10, 12, 
14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 und 54 ergeben, sind 
ebenfalls Bestandteil der Erfindung. 

d) Erfindunqsqemaft verwendete Wirtszellen 

Weitere Gegenstande der Erfindung betreffen als Wirtszelle dienende Mikroorgansismen, insbe- 
sondere coryneforme Bakterien, die einen Vektor, insbesondere Pendelvektor oder Plasmidvek- 
tor, der wenigstens ein metF-Gen gerfindungsgemaUer Definition tragt, enthalten oder in denen 
ein erfindungsgemalies metF-Gen exprimiert bzw. verstarkt ist. 

Diese Mikroorganismen kSnnen schwefelhaltige Feinchemikalien, insbesondere L-Methionin, 
aus Glucose, Saccharose, Lactose, Fructose, Maltose, Melasse, Starke, Cellulose oder aus Gly- 
cerin und Ethanol herstellen. Vorzugsweise sind dies coryneforme Bakterien, insbesondere der 
Gattung Corynebacterium. Aus der Gattung Corynebacterium ist insbesondere die Art Coryne- 
bacterium glutamicum zu nennen, die in der Fachwelt fur ihre FShigkeit bekannt ist, L- 
Aminosauren zu produzieren. 
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Als Beispiele fur geeignete Stamme coryneformer Bakterien sind solche der Gattung Corynebac- 
terium, insbesondere der Art Corynebacterium glutamicum (C. glutamicum), wie 
Corynebacterium glutamicum ATCC 13032, 
Corynebacterium acetoglutamicum ATCC 15806, 
5 Corynebacterium acetoacidophilum ATCC 13870, 

Corynebacterium thermoaminogenes FERM BP-1539, 
Corynebacterium melassecola ATCC 17965 



oder 

1 0 der Gattung Brevibacterium, wie 

Brevibacterium flavum ATCC 14067 
Brevibacterium lactofermentum ATCC 13869 und 
Brevibacterium divaricatum ATCC 14020 zu nennen; 
oder davon abgeleitete Stamme, wie 
1 5 Corynebacterium glutamicum KFCC1 0065 
Corynebacterium glutamicum ATCC21608 



welche ebenfalls die gewunschte Feinchemikalie oder deren Vorstufe(n) produzieren. 
Mit der AbkOrzung KFCC ist die Korean Federation of Culture Collection gemeint, mitder Abkur- 
20 zung ATCC die American type strain culture collection, mit der AbkOrzung FERM BP die Samm- 
lung des National institute of Bioscience and Human-Technology, Agency of Industrial Science 
and Technology, Japan bezeichnet. 



e) Durchfuhrung der erfindunqsqemaften Fermentation 

ErfindungsgemSfi wurde festgestellt, dass coryneforme Bakterien nach Oberexpression eines 
metF-Gens aus Organismen der Liste I in vorteilhafter Weise schwefelhaltige Feinchemikalien, 
insbesondere L-Methionin, produzieren. 

30 

Zur Erzielung einer Oberexpression kann der Fachmann unterschiedliche Malinahmen einzeln 
oder in Kombination ergreifen. So kann die Kopienzahl der entsprechenden Gene erhoht wer- 
den, oderes kann die Promotor-und Regulationsregion oder die Ribosomenbindungsstelle, die 
sich stromaufwarts des Strukturgens befindet, mutiert werden. In gleicher Weise wirken Expres- 
35 sionskassetten, die stromaufwarts des Strukturgens eingebaut werden. Durch induzierbare Pro- 
motoren ist es zusatzlich moglich, die Expression im Verlaufe der fermentativen L-Methionin- 
Produktion zu steigern. Durch Malinahmen zurVerlangerung der LebensdauerdermRNAwird 
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ebenfalls die Expression verbessert. Weiterhin wird durch Verhinderung des Abbaus des En- 
zymproteins ebenfalls die Enzymaktivitat verstarkt. Die Gene oder Genkonstrukte konnen ent- 
weder in Plasmiden mit unterschiedlicher Kopienzahl vorliegen oder im Chromosom integriert 
und amplifiziert sein. Altemativ kann weiterhin eine Uberexpression der betreffenden Gene 
durch Veranderung der Medienzusammensetzung und KulturfOhrung erreicht werden. 

Anleitungen hierzu findet der Fachmann unter anderem bei Martin et al. (Biontechnology 5, 1 37- 
146 (1987)), bei Guerrero et al. (Gene 138, 35-41 (1994)), Tsuchiya und Morinaga 
(Bio/Technology 6, 428-430 (1988)), bei Eikmanns et al. (Gene 102, 93-98 (1991)), in der Euro- 
paischen Patentschrift 0472869, im US Patent 4,601 ,893, bei Schwarzer und PQhler (Biotechno- 
logy 9, 84-87 (1 991 ), bei Remscheid et al. (Applied and Environmental Microbiology 60,1 26-1 32 
(1994), beiLaBarreetal. (Journal of Bacteriology 175. 1001-1007 (1993)), in der Patentanmel- 
dung WO 96/15246, bei Malumbres etal. (Gene 134, 15-24 (1993)), in derjapanischen Offenle- 
gungsschrift J P-A-1 0-229891, bei Jensen und Hammer (Biotechnology and Bioengineering 
58..191-195 (1998)), bei Makrides (Microbiological Reviews 60 : 512-538 (1996) und in bekann- 
ten LehrbOchem der Genetik und Molekularbiologie. 

Gegenstand der Erfindung sind deshalb auch Expressionskonstrukte, enthaltend unter der ge- 
netischen Kontrolle regulativer Nukleinsauresequenzen eine fur ein erfindungsgemalies Poly- 
peptid kodierende Nukleinsauresequenz; sowie Vektoren, umfassend wenigstens eines dieser 
Expressionskonstrukte. Vorzugsweise umfassen solche erfindungsgemalJen Konstrukte 5'- 
stromaufwarts von der jeweiligen kodierenden Sequenzeinen Promotor und 3'-stromabwarts 
eine Terminatorsequenz sowie gegebenenfalls weitere Obliche regulative Elemente, und zwar 
jeweils operativ verknQpft mit der kodierenden Sequenz. Unter einer „operativen VerknOpfung" 
versteht man die sequentielle Anordnung von Promotor. kodierender Sequenz, Terminator und 
gegebenenfalls weiterer regulativer Elemente derart, dass jedes der regulativen Elemente seine 
Funktion bei der Expression der kodierenden Sequenz bestimmungsgemafierfullen kann. Bei- 
spiele fur operativ verknOpfbare Sequenzen sind Aktivrieungssequenzen sowie Enhancer und 
dergleichen. Weitere regulative Elemente umfassen selektierbare Marker, Amplifikationssignale. 
ReplikationsursprQnge und dergleichen. Geeignete regulatorische Sequenzen sind z.B. be- 
schrieben in Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic 
Press, San Diego, CA (1990). 

Zusatzlich zu den artifiziellen Regulationssequenzen kann die natOrliche Regulationssequenz 
vor dem eigentlichen Strukturgen noch vorhanden sein. Durch genetische Veranderung kann 
diese natOrliche Regulation gegebenenfalls ausgeschaltet und die Expression der Gene erhSht 
oder erniedrigt werden. Das Genkonstrukt kann aberauch einfacher aufgebaut sein, das heilit 
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es werden keine zusatzlichen Regulatlonssignale vor das Staikturgen insertiert und der natQrli- 
che Promotor mit seiner Regulation wird nicht entfernt Stattdessen wird die natQrliche Regulati- 
onssequenzso mutiert, dass keine Regulation mehrerfolgt und die Genexpression gesteigert 
oder verringert wird. Die Nukleinsauresequenzen konnen in einer oder mehreren Kopien im 
Genkonstrukt enthalten sein. 



Beispiele fur brauchbare Promotoren sind: die Promotoren, ddh, amy, lysC, dapA, lysA aus Co- 
rynebacterium glutamicum, aber auch gram-positiven Promotoren SP02 wie sie in Bacillus Sub- 
tilis and Its Closest Relatives, Sonenshein, Abraham L.Hoch, James A., Losick, Richard; ASM 
Press, District of Columbia, Washington und Patek M. Eikmanns BJ. Patek J. Sahm H. Microbio- 
logy. 1 42 1 297-309, 1 996 besch rieben sind, oder aber auch cos-, tac-, trp-, tet-, trp-tet-, Ipp-, lac- 
, Ipp-lac-, laclq-, T7-, T5-, T3-, gal-, trc-, ara-, SP6-, l-PR- oder im l-PL-Promotor, die vorteilhaft- 
erweise in gram-negativen Bakterien Anwendung finden. Bevorzugt ist auch die Verwendung 
induzierbarer Promotoren, wie z.B. licht- und insbesondere temperaturinduztierbarer Promoto- 
ren, wie der P,P r Promotor. Prinzipiell konnen alle natOrlichen Promotoren mit ihren Regulations- 
sequenzen verwendet werden. Darilber hinaus k6nnen auch synthetische Promotoren vorteilhaft 
verwendet werden. 



Die genannten regulatorischen Sequenzen sollen die gezielte Expression der Nukleinsaurese- 
quenzen und der Proteinexpression ermSglichen. Dies kann beispielsweise je nach Wirtsorga- 
nismus bedeuten, dass das Gen erst nach Induktion exprimiert oder Qberexprimiert wird, oder 
dass es sofort exprimiert und/oder Qberexprimiert wird. 

Die regulatorischen Sequenzen bzw. Faktoren konnen dabei vorzugsweise die Expression posi- 
tiv beeinflussen und dadurch erhohen oder emiedrigen. So kann eine Verstarkung derregulato- 
rischen Elemente vorteilhafterweise auf der Transkriptionsebene erfolgen, indem starke 
Transkriptionssignale wie Promotoren und/oder "Enhancer" verwendet werden. Daneben istaber 
auch eine Verstarkung der Translation moglich, indem beispielsweise die Stabilitat der mRNA 
verbessert wird. 



Die Herstellung einer Expressionskassette erfolgt durch Fusion eines geeigneten Promotors, 
einer geeigneten Shine-Dalgarnow-Sequenz mit einer metF-Nukleotidsequenz sowie einem ge- 
eigneten Terminationssignal. Dazu verwendet man gangige Rekombinations- und Klonie- 
rungstechniken, wie sie beispielsweise in Current Protocols in Molecular Biology, 1993, John 
Wiley & Sons, Incorporated, New York New York, PCR Methods, Gelfand, David H., Innis, Mi- 
chael A., Sninsky, John J. 1999, Academic Press, Incorporated, California, San Diego, ., PCR 
Cloning Protocols, Methods in Molecular Biology Ser., Vol. 192, 2nd ed., Humana Press, New 
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Jersey, Totowa. T. Maniatis, E.F. Fritsch und J. Sambrook, Molecular Cloning: A Laboratory Ma- 
nual, Cold Spring Harbor Laboratory, Cold Spring Harbor. NY (1989) sowie in TJ. Silhavy, M.L. 
Berman und L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, 
Cold Spring Harbor, NY (1984) und in Ausubel, F.M. etal., Current Protocols in Molecular Biolo- 
gy, Greene Publishing Assoc. and Wiley Interscience (1987) beschrieben sind. 



Das rekombinante Nukleinsaurekonstrukt bzw. Genkonstrukt wird zur Expression in einem ge- 
eigneten Wirtsorganismus vorteilhafterweise in einen wirtsspezifischen Vektor insertiert, der eine 
optimale Expression der Gene im WirtermSglicht. Vektoren sind dem Fachmann wohl bekannt 
1 0 und konnen beispielsweise aus "Cloning Vectors" (Pouwels P. H. et al., Hrsg, Elsevier, Amster- 
dam-New York-Oxford, 1985) entnommen werden. Unter Vektoren sind auller Plasmiden auch 

• alle anderen dem Fachmann bekannten Vektoren, wie beispielsweise Phagen, Transposons, IS- 
Elemente, Phasmide, Cosmide, und lineare oder zirkulare DNA zu verstehen. Diese Vektoren 
konnen autonom im Wirtsorganismus repliziert oder chromosomal repliziert werden. 

15 

Zur Verstarkung wurden erfindungsgemalie metF-Gene beispielhaft mit Hilfe von episomalen 
Plasmiden Oberexprimiert. Als Plasmide eignen sich solche, die in coryneformen Bakterien repli- 
ziert werden. Zahlreiche bekannte Plasmidvektoren, wie z. B. pZ1 (Menkel et al., Applied and 
Environmental Microbiology (1989) 64: 549-554), pEKExl (Eikmanns et al., Gene 102: 93-98 
20 (1991)) oder pHS2-1 (Sonnen et al., Gene 107: 69-74 (1991)) beruhen auf den kryptischen 
Plasmiden pHM1519, pBL1 oder pGA1. Andere Plasmidvektoren, wie z. B. pCLiK5MCS, oder 
solche, die auf pCG4 (US-A 4,489,160) oder pNG2 (Serwold-Davis et al., FEMS Microbiology 
Letters 66, 119-124 (1990)) oder pAG1 (US-A 5,158,891) beruhen, konnen in gleicher Weise 
verwendet werden. 

Weiterhin eignen sich auch solche Plasmidvektoren mit Hilfe derer man das Verfahren der Ge- 
namplifikation durch Integration in das Chromosom anwenden kann, so wie es beispielsweise 
von Remscheid etal. (Applied and Environmental Microbiology 60,1 26-1 32 (1994)) zur Dupiika- 
tion bzw. Amplifikation des hom-thrB-Operons beschrieben wurde. Bei dieser Methode wird das 

30 vollstandige Gen in einen Plasmidvektor kloniert, der in einem Wirt (typischerweise E. coli), nicht 
aber in C. glutamicum replizieren kann. Als Vektoren kommen beispielsweise pSUP301 (Simon 
et al., Bio/ Technology 1,784-791 (1983)), pK18mob oder pK19mob (Schafer et al., Gene 
145,69-73 (1994)), Bernard et al., Journal ofMolecular Biology, 234: 534-541 (1993)). pEM1 
(Schrumpf et al. 1 991 , Journal of Bacteriology 1 73: 451 0--451 6) oder pBGS8 (Spratt et al.,1 986, 

35 Gene 41: 337-342) in Frage. Der Plasmidvektor, der das zu amplifizierende Gen enthalt, wird 
anschlieBend durch Transformation in den gewQnschten Stamm von C. glutamicum OberfOhrt. 
Methoden zur Transformation sind beispielsweise bei Thierbach etal. (Applied Microbiology and 
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Biotechnology 29, 356-362 (1988)), Dunican und Shivnan (Biotechnology 7, 1067-1070 (1989)) 
und Tauch etal. (FEMS Microbiological Letters 123,343-347 (1994)) beschrieben. 

Enzyme kfinnen durch Mutationen in den korrespondierenden Genen derart in ihrer Aktivitat 
beeinflufct werden, dass es zu einer teilweisen oder vollstandigen Verringerung der Reaktions- 
geschwindigkeit der enzymatischen Reaktion kommt. Beispiele fur solche Mutationen sind dem 
Fachmann bekannt (Motoyama H. Yano H. Terasaki Y. Anazawa H. Applied & Environmental 
Microbiology. 67:3064-70, 2001, Eikmanns BJ. Eggeling L. Sahm H. Antonievan Leeuwenhoek. 
64:145-63, 1993-94.) 

Zusatzlich kann es fQr die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, neben einer Expression bzw. Verstarkung eines erfindungsgemaBen 
metF-Gen eines oder mehrere Enzyme des jeweiligen Biosyntheseweges, des Cystein- 
Stoffwechselwegs, der Apratatsemialdehyd-Synthese, der Glykolyse, der Anaplerotik, des Pen- 
tose-Phosphat-Stoffwechsels, des Zitronensaure-Zyklus oder des Aminosaure-Exports zu ver- 
starken. 

So kann fOr die Herstellung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin, 
eines oder mehrere der folgenden Gene verstarkt sein: 

- das fOr eine Aspartatkinase kodierende Gen lysC (EP 1 108 790 A2; DNA-SEQ NO. 281), 
-das fur eine Aspartat-Semialdehyd kodierende Gen asd (EP 1 108 790 A2; DNA-SEQ NO. 
282), 

- das fOr die Glycerinaldehyd-3-Phosphat Dehydrogenase kodierende Gen gap (Eikmanns 
(1992), Journal of Bacteriology 174: 6076-6086), 

- das fQr die 3-Phosphoglycerat Kinase kodierende Gen pgk (Eikmanns (1 992), Journal of Bacte- 
riology 174: 6076-6086), 

- das fur die Pyruvat Carboxylase kodierende Gen pyc (Eikmanns (1 992), Journal of Bacteriology 
174:6076-6086), 

- das fQr die Triosephosphat Isomerase kodierende Gen tpi (Eikmanns (1 992), Journal of Bacte- 
riology^: 6076-6086), 

- das fur die Homoserin O-Acetyltransferase kodierende Gen metA (EP 1 1 08 790 A2; DNA-SEQ 
NO. 725), 

- das fQr die Cystahionin-gamma-Synthase kodierende Gen metB (EP 1 1 08 790 A2; DNA-SEQ 
NO. 3491), 

- das fQr die Cystahionin-gamma-Lyase kodierende Gen metC (EP 1 1 08 790 A2; DNA-SEQ NO. 
3061), 

- das fQr die Serin-Hydroxymethyltransferase kodierende Gen glyA (EP 1 1 08 790 A2; DNA-SEQ 
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NO. 1110), 

- das fOr die O-Acetylhomoserin-Sulfhydrylase kodierende Gen metY (EP 1 108 790 A2; DNA- 
SEQ NO. 726), 

- das fOr die Methionin Synthase kodierende Gen metH (EP 1 108 790 A2), 

5 - das fQr die Phosphoserin-Aminotransferase kodierende Gen serC (EP 1 108 790 A2; DNA- 
SEQ NO. 928) 

- eines fur die Phosphoserin-Phosphatase kodierende Gen serB (EP 1 108 790 A2; DNA-SEQ 
NO. 334, DNA-SEQ NO. 467, DNA-SEQ NO. 2767) 

- das fur die Serine Acetyl-Transferase kodierende Gen cysE (EP 1 108 790 A2; DNA-SEQ NO. 
10 2818) 

- das fur eine Homoserin-Dehydrogenase kodierende Gen horn (EP 1 108 790 A2; DNA-SEQ 
NO. 1306) 

So kann fur die Hersteliung von schwefethaltige Feinchemikalien, insbesondere L-Methionin in 
1 5 coryneformen Bakterien, vorteilhaft sein, gleichzeitig wenigstens eines der nachfolgenden Gene 
zu mutieren, so dass die korrespondierenden Proteine, verglichen mit nicht mutierten Proteinen, 
in geringerem MafSe oder nicht durch einen Stoffwechselmetaboliten in ihrer Aktivitatbeeinflusst 
werden: 

20 - das fur eine Aspartatkinase kodierende Gen lysC (EP 1 108 790 A2; DNA-SEQ NO. 281 ), 

- das fur die Pyruvat Carboxylase kodierende Gen pyc (Eikmanns (1 992), Journal of Bacteriology 
174:6076-6086), 

- das fur die Homoserin O-Acetyltransferase kodierende Gen metA (EP 1 108 790 A2; DNA-SEQ 
NO. 725), 

- das fur die Cystahionin-gamma-Synthase kodierende Gen metB (EP 1 1 08 790 A2; DNA-SEQ 
NO. 3491), 

- das fur die Cystahionin-gamma-Lyase kodierende Gen metC (EP 1 1 08 790 A2; DNA-SEQ NO. 
3061), 

- das fOr die Serin-Hydroxymethyltransferase kodierende Gen glyA (EP 1 108 790 A2; DNA-SEQ 
30 NO. 1110), 

- das fur die O-Acetylhomoserin-Sulfhydrylase kodierende Gen metY (EP 1 108 790 A2; DNA- 
SEQ NO. 726), 

- das fQr die Methionin Synthase kodierende Gen metH (EP 1 108 790 A2), 

- das fur die Phosphoserin-Aminotransferase kodierende Gen serC (EP 1 108 790 A2; DNA- 
35 SEQ NO. 928) 

- eines fOr die Phosphoserin-Phosphatase kodierende Gen serB (EP 1 108 790 A2; DNA-SEQ 
NO. 334, DNA-SEQ NO. 467, DNA-SEQ NO. 2767) 



M/43126 



MetF 



BASF Aktiengesellschai 



20020289 



0000053880 



21 



- das fur die Serine Acetyl-Transferase kodierende Gen cysE (EP 1 1 08 790 A2; DNA-SEQ NO. 
2818) 

-das fQreine Homoserin-Dehydrogenase kodierende Gen horn (EP 1 108 790 A2; DNA-SEQ 
NO. 1306) 

Weiterhin kann es fur die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaftsein, zusatzlich zur Expression bzw. Verstarkung eines der erfindungsge- 
malien metF-Gene eines Oder mehrere der folgenden Gene abzuschwachen, insbesondere de- 
ren Expression zu verringern, oder auszuschalten: 

- das fur die Homoserine-Kinase kodierende Gen thrB (EP 1 108 790 A2; DNA-SEQ NO. 3453) 

- das fur die Threonin Dehydratase kodierende Gen ilvA (EP 1 108 790 A2; DNA-SEQ NO. 
2328) 

- das fur die Threonin Synthase kodierende Gen thrC (EP 1 108 790 A2; DNA-SEQ NO. 3486) 

- das fOr die Meso-Diaminopimelat D-Dehydrogenase kodierende Gen ddh (EP 1 108 790 A2; 
DNA-SEQ NO. 3494) 

- das fur die Phosphoenolpyruvat-Carboxykinase kodierende Gen pck (EP 1 1 08 790 A2; DNA- 
SEQ NO. 3157) 

- das fOr die Glucose-6-Phosphat-6-lsomerase kodierende Gen pgi (EP 1 108 790 A2; DNA- 
SEQ NO. 950) 

- das fur die Pyruvat-Oxidase kodierende Gen poxB (EP 1 108 790 A2; DNA-SEQ NO. 2873) 

- das fur die Dihydrodipicolinat Synthase kodiernde Gen dapA(EP 1 1 08 790 A2; DNA-SEQ NO. 
3476) 

- das fur die Dihydrodipicolinat Reduktase kodiernde Gen dapB (EP 1 108 790 A2; DNA-SEQ 
NO. 3477) 

- das fur die Diaminopicolinat Decarboxylase kodiernde Gen lysA (EP 1 1 08 790 A2; DNA-SEQ 
NO. 3451) 

Weiterhin kann es fur die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, zusatzlich zur Expression bzw. Verstarkung eines der erfindungsge- 
mafien metF-Gene in coryneformen Bakterien gleichzeitig wenigstens eines der folgenden Gene 
so zu mutieren, dass die enzymatische Aktivitat des korrespondierenden Proteins teilweise oder 
vollstandig verringert wird: 

- das fur die Homoserine-Kinase kodierende Gen thrB (EP 1 1 08 790 A2; DNA-SEQ NO. 3453) 

- das fOr die Threonin Dehydratase kodierende Gen ilvA (EP 1 108 790 A2; DNA-SEQ NO. 
2328) 
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- das fur die Threonin Synthase kodierende Gen thrC (EP 1 108 790 A2; DNA-SEQ NO. 3486) 

- das fur die Meso-Diaminopimelat D-Dehydrogenase kodierende Gen ddh (EP 1 108 790 A2; 
DNA-SEQ NO. 3494) 

-das fOr die Phosphoenolpyruvat-Carboxykinase kodierende Gen pck (EP 1 108 790 A2; DNA- 
5 SEQNO. 3157) 

- das fur die GIucose-6-Phosphat-6-lsomerase kodierende Gen pgi (EP 1 108 790 A2; DNA- 
SEQ NO. 950) 

-das fOrdie Pyruvat-Oxidase kodierende Gen poxB (EP 1 108 790 A2; DNA-SEQ NO. 2873) 
-das fOr die Dihydrodipicolinat Synthase kodiernde Gen dapA(EP 1 108 790 A2; DNA-SEQ NO. 
10 3476) 

- das fur die Dihydrodipicolinat Reduktase kodiernde Gen dapB (EP 1 108 790 A2; DNA-SEQ 
NO. 3477) 

- das fOr die Diaminopicolinat Decarboxylase kodiernde Gen lysA (EP 1 108 790 A2; DNA-SEQ 
NO. 3451) 

15 

Weiterhin kann es fur die Produktion von schwefelhaitige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, neben der Expression bzw. Verstarkung eines erfindungsgemafien 
metF-Gens unerwunschte Nebenreaktionen auszuschalten (Nakayama: "Breeding of Amino Acid 
Producing Microorganisms", in: Overproduction of Microbial Products, Krumphanzl, Sikyta, Va- 
20 nek (eds.), Academic Press, London, UK, 1982). 

Die erfindungsgemafJ hergestellten Mikroorganismen konnen kontinuierlich oder diskontinuier- 
lich im batch- Verfahren (Satzkultivierung) oder im fed batch (Zulaufverfahren) Oder repeated fed 
batch Verfahren (repetitives Zulaufverfahren) zur Produktion von schwefelhaitige Feinchemika- 
lien, insbesondere L-Methionin, kultiviertwerden. Eine Zusammenfassung Qber bekannte Kulti- 
vierungsmethoden ist im Lehrbuch von Chmiel (Bioprozefitechnik 1 . EinfOhrung in die Bioverfah- 
renstechnik (Gustav Fischer Verlag, Stuttgart, 1991 )) oder im Lehrbuch von Storhas (Bioreakto- 
ren und periphere Einrichtungen (Vieweg Verlag, Braunschweig/Wiesbaden, 1994))zu finden. 

30 Das zu verwendende Kulturmedium hat in geeigneter Weise den Anspruchen der jeweiligen 
Stamme zu genugen. Beschreibungen von Kulturmedien verschiedener Mikroorganismen sind 
im Handbuch "Manual of Methods fur General Bacteriology" der American Society fur Bacterio- 
logy (Washington D. C, USA, 1981) enthalten. 

35 Diese erfindungsgemafJ einsetzbaren Medien umfassen gewShnlich eine oder mehrerenKoh- 
lenstoffquelien, Stickstoffquellen, anorganische Salze, Vitamine und/oder Spurenelemente. 
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Bevorzugte Kohlenstoffquellen sind Zucker, wie Mono-, Di- Oder Polysaccharide. Sehr gute Koh- 
lenstoffquellen sind beispielsweise Glucose, Fructose, Mannose, Galactose, Ribose, Sorbose, 
Ribulose, Lactose, Maltose, Saccharose, Raffinose, Starke oder Cellulose. Man kann Zucker 
auch Ober komplexe Verbindungen, wie Melassen, oder andere Nebenprodukte der Zucker- 
Raffinierung zu den Medien geben. Es kann auch vorteilhaft sein, Gemische verschiedener Koh- 
lenstoffquellen zuzugeben. Andere mOgliche Kohlenstoffquellen sind Ole und Fette wie z. B. 
Sojaol. Sonnenblumenol. Erdnuliol und Kokosfett, Fettsauren wiez. B. PalmitinsSure, Stearin- 
saure oder Linolsaure, Alkohole wie z. B. Glycerin, Methanol oder Ethanol und organische Sau- 
ren wie z. B. Essigsaure oder Milchsaure. 

Stickstoffquellen sind gewohnlich organische oder anorganische Stickstoffverbindungen oder 
Materialien, die diese Verbindungen enthalten. Beispielhafte Stickstoffquellen umfassen Ammo- 
niak-Gas oder Ammoniumsalze, wie Ammoniumsulfat, Ammoniumchlorid, Ammoniumphosphat, 
Ammoniumcarbonat oder Ammoniumnitrat, Nitrate, Harnstoff, Aminosauren oder komplexe 
Stickstoffquellen, wie Maisquellwasser, Sojamehl, Sojaprotein, Hefeextrakt, Fleischextrakt und 
andere. Die Stickstoffquellen konnen einzeln oder als Mischung verwendet werden. 

Anorganische Salzverbindungen, die in den Medien enthalten sein konnen, umfassen die Chlo- 
rid-, Phosphor- oder Sulfatsalze von Calcium, Magnesium, Natrium, Kobalt, MolybdSn, Kalium, 
Mangan, Zink, Kupfer und Eisen 

Als Schwefelquelle fQr die Herstellung von schwefelhaltigen Feinchemikalien, insbesondere von 
Methionin, konnen anorganische schwefelhaltige Verbindungen wie beispielsweise Sulfate, Sulfi- 
te, Dithionite, Tetrathionate, Thiosulfate, Sulfide aber auch organische Schwefelverbindungen, 
wie Mercaptane und Thiole, verwendet werden. 

Als Phosphorquelle konnen Phosphorsaure, Kaliumdihydrogenphosphat oder Dikaliumhydro- 
genphosphat oder die entsprechenden Natrium haltigen Salze verwendet werden. 

Chelatbildner konnen zum Medium gegeben werden, urn die Metallionen in Losung zu halten. 
Besonders geeignete Chelatbildner umfassen Dihydroxyphenole, wie Catechol oderProtocate- 
chuat, oder organische Sauren, wie Citronensaure. 

Die erfindungsgemaft eingesetzten Fermentationsmedien enthalten ublicherweise auch andere 
Wachstumsfaktoren, wie Vitamine oder Wachstumsfdrderer, zu denen beispielsweise Biotin, 
Riboflavin, Thiamin, Folsaure, Nikotinsaure, Panthothenat und Pyridoxin gehoren. Wachstums- 
faktoren und Salze stammen haufig von komplexen Medienkomponenten, wie Hefeextrakt, Me- 
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lassen, Maisquellwasserund dergleichen. Dem Kulturmedium konnen Oberdiesgeeignete Vor- 
stufen zugesetzt werden. Die genaue Zusammensetzung der Medienverbindungen hangt stark 
vom jeweiligen Experiment ab und wird fQr jeden spezifischen Fall individuell entschieden. In- 
formation Ober die Medienoptimierung ist erhaltlich aus dem Lehrbuch "Applied Microbiol. Physi- 
5 ology, A Practical Approach" (Hrsg. P.M. Rhodes, P.F. Stanbury, IRL Press (1997) S. 53-73, 
ISBN 0 19 963577 3). Wachstumsmedien lassen sich auch von kommerziellen Anbietern bezie- 
hen, wie Standard 1 (Merck) oder BHI (Brain heart infusion, DIFCO) und dergleichen. 

Samtliche Medienkomponenten werden, entwederdurch Hitze (20 min bei 1,5 bar und 121°C) 
oder durch Sterilfiltration, sterilisiert. Die Komponenten konnen entweder zusammen oder noti- 
genfalls getrennt sterilisiert werden. Samtliche Medienkomponenten konnen zu Beginn der An- 
zucht zugegen sein oder wahlfrei kontinuierlich oder chargenweise hinzugegeben werden. 

Die Temperatur der Kultur liegt normalerweise zwischen 1 5°C und 45°C, vorzugsweise bei 25°C 
bis 40°C und kann wahrend des Experimentes konstant gehalten oder verandert werden. Der 
pH-Wertdes Mediums sollte im Bereich von 5 bis 8,5, vorzugsweise um 7,0 liegen. DerpH-Wert 
fQr die Anzucht lafit sich wahrend der Anzucht durch Zugabe von basische Verbindungen wie 
Natriumhydroxid, Kaliumhydroxid, Ammoniak bzw. Ammoniakwasser oder saure Verbindungen 
wie PhosphorsSure oder SchwefelsSure kontrollieren. Zur Kontrolle der Schaumentwicklung 
kSnnen Antischaummitte.l wie z. B. Fettsaurepolyglykolester, eingesetzt werden. Zur Aufrechter- 
haltung der Stabilitat von Plasmiden konnen dem Medium geeignete selektiv wirkende Stoffe, 
wiez. B. Antibiotika, hinzugefQgt werden. Um aerobe Bedingungen aufrechtzuerhalten, werden 
Sauerstoff oder Sauerstoff haltige Gasmischungen, wie z. B. Umgebungsluft, in die Kultur einge- 
tragen. Die Temperatur der Kultur liegt normalerweise bei 20°C bis 45°C und. Die Kultur wird 
solange fortgesetzt, bis sich ein Maximum des gewunschten Produktes gebildet hat. Dieses Ziel 
wird normalerweise innerhalb von 10 Stunden bis 160 Stunden erreicht. 

Die so erhaltenen, insbesondere L-Methionin enthaltenden, Fermentationsbrtihen haben Obli- 
cherweise eine Trockenmasse von 7,5 bis 25 Gew.-%. 

Vorteilhaft ist aulierdem auch, wenn die Fermentation zumindest am Ende, insbesondere jedoch 
uber mindestens 30% der Fermentationsdauer zuckerlimitiert gefahren wird. Das heifit, dass 
wahrend dieser Zeit die Konzentration an verwertbarem Zucker im Fermentationsmedium auf > 0 
bis 3 g/l gehalten, beziehungsweise abgesenkt wird. 

Die FermentationsbrOhe wird anschlieftend weiterverarbeitet. Je nach Anforderung kann die 
Biomasse ganz oder teilweise durch Separationsmethoden, wie z. B. Zentrifugation, Filtration, 
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Dekantieren oder einer Kombination dieser Methoden aus der Fermentattonsbriihe entfernt oder 
vollstandig in ihr belassen werden. 

AnschliefJend kann die Fermentationsbriihe rnit bekannten Methoden, wie z. B. mit Hilfe eines 
5 Rotationsverdampfers, Dunnschichtverdampfers, Falifilmverdampfers, durch Umkehrosmose, 
oder durch Nanofiltration, eingedickt beziehungsweise aufkonzentriert werden. Diese aufkon- 
zentrierte FermentationsbrQhe kann anschlieftend durch Gefriertrocknung, Spruhtrocknung, 
Spruhgranulation oder durch anderweitige Verfahren aufgearbeitet werden. 

10 Es ist aber auch moglich die schwefelhaltigen Feinchemikalien, insbesonder L-Methionin, weiter 
aufzureinigen. Hierzu wird die produkthaltige BrQhe nach dern Abtrennen der Biomasse einer 
Chromatographie mit einem geeigneten Harz unterworfen, wobei das gewQnschte Produkt oder 
die Verunreinigungen ganz oder teilweise auf dem Chromatographieharz zurQckgehalten wer- 
den. Diese Chromatographieschritte konnen notigenfalls wiederholt werden, wobei die gleichen 
1 5 oder andere Chromatographieharze verwendet werden. Der Fachmann ist in der Auswahl der 
geeigneten Chromatographieharze und ihrer wirksamsten Anwendung bewandert. Das gereinig- 
te Produkt kann durch Filtration oder Ultrafiltration konzentriert und bei einer Temperatur aufbe- 
wahrt werden, bei der die Stabilitat des Produktes maximal ist. 

20 Die Identitat und Reinheit der isolierten Verbindung(en) kann durch Techniken des Standes der 
Technik bestimmt werden. Diese umfassen Hochleistungs-FIQssigkeitschromatographie (HPLC), 
spektroskopische Verfahren, Farbeverfahren, Dunnschichtchromatographie, NIRS, Enzymtest 
oder mikrobiologische Tests. Diese Analyseverfahren sind zusammengefafJt in: Patek et al. 
(1994) Appl. Environ. Microbiol. 60:133-140; Malakhova etaL (1996) Biotekhnologiya 11 27-32; 
und Schmidt et al. (1998) Bioprocess Engineer. 19:67-70. Ulmann's Encyclopedia of Industrial 
Chemistry (1996) Bd. A27, VCH: Weinheim, S. 89-90, S. 521-540, S. 540-547, S. 559-566, 575- 
581 und S. 581-587; Michal, G (1999) Biochemical Pathways: An Atlas of Biochemistry and Mo- 
lecular Biology, John Wiley and Sons; Fallon, A. et al. (1 987) Applications of HPLC in Bioche- 
mistry in: Laboratory Techniques in Biochemistry and Molecular Biology, Bd. 17. 

30 

Die Erfindung wird nun anhand derfolgenden nicht-limitierenden Beispiele naherbeschrieben: 
Beispiel 1: Konstruktion von pCLiKSMCS 

35 Zunachst wurden Ampicillinresistenz und Replikationsursprung des Vektors pBR322 mit den 
Oligonukleotiden p1.3 (SEQ ID NO:55) und p2.3 (SEQ ID NO:56) mit Hilfe der Polymerase- 
Kettenreaktion (PCR) amplifiziert. 
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p1.3 (SEQ ID NO:55) 

5'-CCCGGGATCCGCTAGCGGCGCGCCGGCCGGCCCGGTGTGAAATACCGCACAG-3' 

5 p2.3 (SEQ ID NO:56) 

5'-TCTAGACTCGAGCGGCCGCGGCCGGCCTTTAAATTGAAGACGAAAGGGCCTCG-3' 

Neben den zu pBR322 komplementaren Sequenzen, enthaltdas Oligonukleotid p1.3 (SEQ ID 
NO:55) in 5-3' Richtung die Schnittstellen ftlr die Restriktionsendonukleasen Smal, BamHI, Nhel 
und AscI und das Oligonukleotid p2.3 (SEQ ID NO:56) in 5-3' Richtung die Schnittstellen fOr 
die Restriktionsendonukleasen Xbal, Xhol, Notl und Dral. Die PCR Reaktion wurde nach Stan- 
dardmethode wie Innis et al. (PCR Protocols. A Guide to Methods and Applications, Academic 
Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla. USA) durchgefuhrt Das erhalte- 
ne DNA Fragment mit einer Grolie von ungefahr 2,1 kb wurde mit dem GFX™PCR, DNA and 
Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers gerei- 
nigt. Die stumpfen Enden des DNA-Fragmentes wurden mit dem Rapid DNA Ligation Kit (Roche 
Diagnostics, Mannheim) nach Angaben des Herstellers miteinander ligiert und der Ligationsan- 
satz nach Standard methoden wie in Sambrook et al. (Molecular Cloning. A Laboratory Manual, 
Cold Spring Harbor, beschrieben(1989)), in kompetente E.coli XL-1Blue (Stratagene, La Jolla, 
USA) transformiert. Eine Selektion auf Plasmid tragende Zellen wurde durch das Ausplattieren 
auf Ampicillin (50ug/ml) haltigen LB Agar (Lennox, 1 955, Virology, 1 :190) erreicht. 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und uber Restriktionsverdaus uberpruft. Das so 
erhaltene Plasmid erh§lt den Namen pCLiKI . 

Ausgehend vom Plasmid pWLT1 (Liebl etal., 1 992) als Template fur eine PCR Reaktion wurde 
mit den Oligonukleotiden neol (SEQ ID NO:57) und neo2 (SEQ ID NO:58) eine Kanamycin- 
Resistenzcassette amplifiziert. 

neol (SEQ ID NO:57): 

5'-GAGATCTAGACCCGGGGATCCGCTAGCGGGCTGCTAAAGGAAGCGGA-3' 

neo2 (SEQ ID NO:58): 
35 5'-GAGAGGCGCGCCGCTAGCGTGGGCGAAGAACTCCAGCA-3' 

Neben den zu pWLT1 komplementaren Sequenzen, enthalt das Oligonukleotid neol in 5'-3' 
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Richtung die Schnittstellen fur die Restriktionsendonukleasen Xbal, Smal, BamHI, Nhel und das 
Oligonukleotid neo2 (SEQ ID NO:58) in 5'-3* Richtung die Schnittstellen fOrdie Restriktionsen- 
donukleasen AscI und Nhel. Die PCR Reaktion wurde nach Standardmethode wie Innis et al. 
(PCR Protocols. A Guide to Methods and Applications, Academic Press (1990)) mit PfuTurbo 
Polymerase (Stratagene, La Jolla, USA) durchgefOhrt. Das erhaltene DNA Fragment mit einer 
Grolie von ungefahr 1 ,3 kb wurde mit dem GFX™PCR, DNA and Gel Band Purification Kit (A- 
mersham Pharmacia, Freiburg) nach Angaben des Herstellers gereinigt. Das DNA-Fragment 
wurde mit den Restriktionsendonukleasen Xbal und AscI (New England Biolabs, Beverly, USA) 
geschnitten und im Anschluli daran erneut mit dem GFX™PCR, DNA and Gel Band Purification 
Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers gereinigt. Der Vektor 
pCLiKI wurde ebenfalls mit den Restriktionsendonukleasen Xbal und AscI geschnitten und mit 
alkalischer Phosphatase (Roche Diagnostics, Mannheim) nach Angaben des Herstellers 
dephosphoryliert. Nach Elektrophorese in einem 0,8%igen Agarosegel wurde der linearisierte 
Vektor (ca. 2,1 kb) mit dem GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharma- 
cia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor-Fragment wurde mit Hilfe 
des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach Angaben des Herstellers mit 
dem geschnittenen PCR Fragment ligiert und der Ligationsansatz nach Standardmethoden wie 
in Sambrook et al. (Molecular Cloning. A Laboratory Manual, Cold Spring Harbor, beschrie- 
ben(1 989)), in kompetente E.coli XL-1 Blue (Stratagene, La Jolla, USA) transformiert. Eine Selek- 
tion auf Plasmid tragende Zellen wurde durch das Ausplattieren auf Ampicillin (50pg/ml) und 
Kanamycin (20pg/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht. 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und uber Restriktionsverdaus Oberprilft. Das so 
erhaltene Plasmid erhalt den Namen pCLiK2. 

Der Vektor pCLiK2 wurde mit der Restriktionsendonuklease Dral (New England Biolabs, Beverly, 
USA) geschnitten. Nach Elektrophorese in einem 0,8%igen Agarosegel wurde ein ca. 2,3 kb 
gro&es Vektorfragment mit dem GFX™PCR, DNA and Gel Band Purification Kit (Amersham 
Pharmacia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor-Fragment wurde mit 
Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach Angaben des Herstellers 
religiert und der Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Molecular Clo- 
ning. A Laboratory Manual, Cold Spring Harbor, beschrieben (1989)), in kompetente E.coli XL- 
1Blue (Stratagene, La Jolla, USA) transformiert. Eine Selektion auf Plasmid tragende Zellen 
wurde durch das Ausplattieren auf Kanamycin (20ug/ml) haltigen LB Agar (Lennox, 1955, Viro- 
logy, 1:190) erreicht. 
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Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und Qber Restriktionsverdaus QberprOft. Das so 
erhaltene Plasmid erhalt den Namen pCLiK3. 

Ausgehend vom Plasmid pWLQ2 (Liebl et al., 1 992) als Template fOr eine PCR Reaktion wurde 
mit den Oligonukleotiden cg1 ((SEQ ID NO:59) und cg2 (SEQ ID NO:60) der Replikation- 
sursprung pHM1519 amplifiziert. 

cg1 (SEQ ID NO:59): 

5-GAGAGGGCGGCCGCGCAAAGTCCCGCTTCGTGAA-3* 
cg2 (SEQ ID NO:60): 

5'-GAGAGGGCGGCCGCTCAAGTCGGTCAAGCCACGC-3' 

Neben den zu pWLQ2 komplementaren Sequenzen, enthalten die Oligonukleotide cg1 (SEQ ID 
NO:59) und cg2 (SEQ ID NO:60) Schnittstellen fur die Restriktionsendonuklease Notl. Die PCR 
Reaktion wurde nach Standardmethode wie Innis etal. (PCR Protocols. A Guide to Methods and 
Applications. Academic Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) 
durchgefOhrt. Das erhaltene DNA Fragment mit einer Grofte von ungefahr2,7kb wurde mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. Das DNA-Fragment wurde mit der Restriktionsendonuklease Notl 
(New England Biolabs, Beverly, USA) geschnitten und im AnschluB daran emeut mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. Der Vektor pCLiK3 wurde ebenfalls mit der Restriktionsendonuklease 
Notl geschnitten und mit alkalischer Phosphatase (Roche Diagnostics, Mannheim)) nach Anga- 
ben des Herstellers dephosphoryliert. Nach Elektrophorese in einem 0,8%igen Agarosegel wur- 
de der linearisierte Vektor (ca. 2,3kb) mit dem GFX™PCR, DNA and Gel Band Purification Kit 
(Amersham Pharmacia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor- 
Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach An- 
gaben des Herstellers mit dem geschnittenen PCR Fragment ligiert und der Ligationsansatz 
nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laboratory Manual, Cold 
Spring Harbor, beschrieben(1989)), in kompetente E.coliXL-1 Blue (Stratagene, La Jolla, USA) 
transformiert. Eine Selektion auf Plasmid tragende Zellen wurde durch das Ausplattieren auf 
Kanamycin (20ug/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht. 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und Qber Restriktionsverdaus QberprOft. Das so 
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erhaltene Plasmid erhaltden Namen pCLiKS. 

FQr die Erweiterung von pCLik5 um eine „multiple cloning site" (MCS) wurden die beide syntheti- 
schen, weitestgehend komplementaren Oligonukleotide HS445 ((SEQ ID NO:61) und HS446 
5 (SEQ ID NO:62), die Schnittstellen fur die Restriktionsendonukleasen Swal, Xhol, Aatl, Apal, 
Asp718, MIul, Ndel, Spel, EcoRV, Sail, Clal, BamHI, Xbal und Smal enthalten, durch gemein- 
sames erhitzen auf 95°C und langsames abkQhlen zu einem doppelstrangigen DNA-Fragment 
vereinigt 

10 HS445(SEQIDNO:61): 

5-TCGAATTTAAATCTCGAGAGGCCTGACGTCGGGCCCGGTACCACGCGTCATATGACTAG 

>TTCGGACCTAGGGATATCGTCGACATCGATGCTCTTCTGCGTTAATTAACAATTGGGATCC 
TCTAGACCCGGGATTTAAAT-3 , 

1 5 HS446 (SEQ ID NO:62): 

S-GATCATTTAAATCCCGGGTCTAGAGGATCCCAATTGTTAATTAACGCAGAAGAGCATCGA 
TGTCGACGATATCCCTAGGTCCGAACTAGTCATATGACGCGTGGTACCGGGCCCGACGTC 
AGGCCTCTCGAGATTTAAAT-3' 

Der Vektor pCLiKS wurde mit den Restriktionsendonuklease Xhol und BamHI (New England 
Biolabs, Beverly, USA) geschnitten und mit alkalischer Phosphatase (I (Roche Diagnostics, 
Mannheim)) nach Angaben des Herstellers dephosphoryliert. Nach Elektrophorese in einem 
0,8%igen Agarosegel wurde der linearisierte Vektor (ca. 5,0 kb) mit dem GFX™PCR, DNA and 
Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers iso- 
liert. Dieses Vektor-Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, 
Mannheim) nach Angaben des Herstellers mit dem synthetischen Doppelstrangigen DNA- 
Fragment ligiert und der Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Mole- 
cular Cloning. A Laboratory Manual, Cold Spring Harbor, beschrieben(1989)), in kompetente 
E.coli XL-1 Blue (Stratagene, La Jolla, USA) transformiert. Eine Selektion auf Plasmid tragende 
Zellen wurde durch das Ausplattieren auf Kanamycin (20pg/ml) haltigen LB Agar (Lennox, 1 955, 
Virology, 1:190) erreicht 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und Qber Restriktionsverdaus uberpruft. Das so 
35 erhaltene Plasmid erhalt den Namen pCUKSMCS. 

Sequenzierungsreaktionen wurden nach Sanger etal. (1977) Proceedings of the National Aca- 




0000053880 



M/43126 



MetF 



BASF Aktlengesellscha 20020289 0000053880 

30 

demy of Sciences USA 74:5463-5467 durchgefCihrt. Die Sequenzierreaktionen wurclen mittels 
ABI Prism 377 (PE Applied Biosystems, Weiterstadt) aufgetrennt und ausgewertet. 

Das entstandene Plasmid pCLiK5MCS ist als SEQ ID NO: 65 aufgefuhrt 

5 

Beispiel 2: Konstruktion von pCLiKSMCS integrativ sacB 

Ausgehend vom Plasmid pK1 9mob (Schaferetal., Gene 145,69-73(1994)) als Template fureine 
PCR Reaktion wurde mit den Oiigonukleotiden BK1732 und BK1733 das Bacillus subtilis sacB 
10 Gen (kodierend fur Levan Sucrase) amplifiziert 



• BK1 732 (SEQ ID NO:63): 
5-GAGAGCGGCCGCCC3ATCCTTTTTAACCCATCAC-3' 

1 5 BK1 733 (SEQ ID NO:64): 

5 l -AGGAGCGGCCGCCATCGGCATTTTCTTTTGCG-3 , 



Neben den zu pEK19mobsac komplementaren Sequenzen, enthalten die Ollgonukleotide 
BK1732 und BK1733 Schnittstellen fur die Restriktionsendonuklease NotL Die PCR Reaktion 
wurde nach Standardmethode wie Innis et al. (PCR Protocols. A Guide to Methods and Applica- 
tions, Academic Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) durchge- 
fOhrt. Das erhaltene DNA Fragment mit einer Grofle von ungefShr 1,9 kb wurde mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. Das DNA-Fragment wurde mit der Restriktionsendonuklease Notl 
(New England Biolabs, Beverly, USA) geschnitten und im Anschlufi daran emeut mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. 

Der Vektor pCLiKSMCS (hergestellt gemali Beispiel 1 ) wurde ebenfalls mit der Restriktionsen- 
30 donuklease Notl geschnitten und mit alkalischer Phosphatase (I (Roche Diagnostics, Mann- 
heim)) nach Angaben des Herstellers dephosphoryliert. Nach Elektrophorese in einem 0,8%igen 
Agarosegel wurde ein ungefahr 2,4 kb grofles Vektorfragment mit dem GFX™PCR, DNA and 
Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers iso- 
liert Dieses Vektor-Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, 
35 Mannheim) nach Angaben des Herstellers mit dem geschnittenen PCR Fragment ligiert und der 
Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laborato- 
ry Manual, Cold Spring Harbor, beschrieben(1989)), in kompetente E.coliXL-1Blue (Stratagene, 
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La Jolla, USA) transformiert Eine Selektion auf Plasmid tragende Zellen wurde durch das Aus- 
plattieren auf Kanamycin (20Mg/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht. 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und Ober Restriktionsverdaus Oberpriift. Das so 
erhaltene Plasmid erhalt den Namen pCLiKSMCS integrativ sacB. 

Sequenzierungsreaktionen wurden nach Sanger etal. (1977) Proceedings of the National Aca- 
demy of Sciences USA 74:5463-5467 durchgefuhrt Die Sequenzierreaktionen wurden mittels 
ABI Prism 377 (PE Applied Biosystems, Weiterstadt) aufgetrennt und ausgewertet. 

Das entstandene Plasmid pCLiKSMCS integrativ sacB ist als SEQ ID NO: 66 aufgefuhrt. 
Weitere Vektoren die zur erfindungsgemalien Expression oder Oberproduktion von metF-Genen 
geeignet sind, konnen in analoger Weise herstellt werden. 
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1. Verfahren zur fermentativen Herstellung wenigstens einer schwefelhaltigen 
Feinchemikalie, welches folgende Schritte umfasst: 

a) Fermentation einer die gewGnschte schwefelhaltige Feinchemikalie 
produzierenden coryneformen Bakterienkultur, wobei in den coryneformen 
Bakterien zumindest eine heterologe Nukleotidsequenz exprimiert wird, 
welche fur ein Protein mit Methionin-Synthase (metF) -Aktivitat kodiert; 

b) Anreicherung der schwefelhaltigen Feinchemikalie im Medium oder in den 
Zellen der Bakterien, und 

c) Isolieren der schwefelhaltigen Feinchemikalie. 

2. Verfahren nach Anspruch 1, wobei die schwefelhaltige Feinchemikalie L-Methionin 
umfasst. 

3. Verfahren nach einem der vorhergehenden AnsprOche, wobei sich die heterologe metF- 
kodierende Nukleotidsequenz zur metF-kodierenden Sequenz aus Corynebacterium 
glutamicum ATCC 13032 eine Sequenzhomologie vom weniger als 100% aufweist. 

4. Verfahren nach Anspruch 3, wobei die metF-kodierende Sequenz aus einem der 
folgenden Organismen abgeleitet ist: 



Organimsus 


Stammsammlung 


Corynebacterium diphteriae 


ATCC 14779 


Streptomyces lividans 


ATCC 19844 


Streptomyces coelicolor 


ATCC 10147 


Aquifex aeolicus 


DSM 6858 


Burkholderia cepacia 


ATCC 25416 


Nitrosomonas europaea 


ATCC 19718 


Pseudomonas aeruginosa 


ATCC 17933 


Xylella fastidiosa 


ATCC 35881 


Pseodomonas fluorescens 


ATCC 13525 


Schizosaccharomyces pombe 


ATCC 24969 


Saccharomyces cerevisiae 


ATCC 10751 


Erwinia carotovora 


ATCC 15713 


Klebsiella pneumoniae 


ATCC 700721 


Salmonella typhi 


ATCC 12839 


Salmonella typhimurium 


ATCC 15277 


Escherichia coli K12 


ATCC55151 
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Vibrio cholerae 


ATCC 3^315 


Haemophilus influenzae 


ATCC 51SJU7 


Caulobacter crescentus 


ATCC 19089 


Actinobacillus 

oc imoiny wcicmconutans 


ATCC 33384 


Neisseria meningitis 


ATCC 6253 


Rhodobacter capsulatus 


ATCC 11166 


Campylobacter jejuni 


ATCC 33560 


Lactococcus lactis 


ATCC 7962 


Prochlorococcus marinus 


PCC7118 


Bacillus stearothermophilus 


ATCC 12980 



5. Verfahren nach einem der vorhergehenden Anspruche, wobei die metF-kodierende 
Sequenzeine kodlerende Sequenz gemafi SEQ ID NO:1, 3 f 5, 7, 9, 11, 13, 15, 17, 19, 
21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51 und 53 Oder eine dazu 
homologe Nukleotidsequenz, welchefOrein Protein mit metF-Aktivitatkodiert, umfasst. 

6. Verfahren nach einem der vorhergehenden AnsprOche, wobei die metF-kodierende 
Sequenz fur ein Protein mit metF-Aktivitat kodiert, wobei das Protein eine 
Aminosauresequenz gemafi SEQ ID NO:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 
30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 und 54 Oder eine dazu homologe 
Aminosauresequenz, welche fur ein Protein mit metF-Aktivitat steht, umfasst. 

7. Verfahren nach einem der vorhergehenden Anspruche, wobei die kodierende metF- 
Sequenz eine in coryneformen Bakterien replizierbare oder eine stabil in das 
Chromosom intregrierte DNA oder eine RNA ist. 

8. Verfahren gemafi Anspruch 7, wobei man 

a) einen mit einem Plasmidvektor transformierten Bakterienstamm einsetzt der 
wenigstens eine Kopie der kodierenden metF-Sequenz unter der Kontrolle 
regulativer Sequenzen tragt, oder 

b) einen Stamm einsetzt, in dem die kodierende metF-Sequenz in das Chromosom 
des Bakteriums integriert wurde 

9. Verfahren nach einem der vorhergehenden AnsprOche, wobei die kodierende metF- 
Sequenz uberexprimiert wird. 
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10. Verfahren gemali einem der vorhergehenden AnsprQche, wobei man Bakterien 
fermentiert, in denen zusatzlich wenigstens ein weiteres Gen des Biosyntheseweges der 
gewOnschten schwefelhaltigen Feinchemikalie verstarkt ist Oder derart mutiert ist, dass 
es durch Stoffwechselmetabolite nicht in seiner Aktivitat beeinflusst wird. 

11. Verfahren gemali einem der vorhergehenden AnsprQche, wobei man Bakterien 
fermentiert, in denen wenigstens ein Stoffwechselweg zumindestteilweise ausgeschaltet 
sind, der die Bildung der gewOnschten schwefelhaltigen Feinchemikalie verringert 

12. Verfahren gemafi einem der vorhergehenden AnsprQche, wobei man coryneforme 
Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt unter 

a) dem fOr eine Aspartatkinase kodierenden Gen lysC, 

b) dem fQr die Glycerinaldehyd-3-Phosphat Dehydrogenase kodierenden Gen gap, 

c) dem fur die 3-Phosphoglycerat Kinase kodierenden Gen pgk, 

d) dem fur die Pyruvat Carboxylase kodierenden Gen pyc, 

e) dem fur die Triosephosphat Isomerase kodierenden Gen tpi, 

f) dem fur die Homoserin O-Acetyltransferase kodierenden Gen metA, 

g) dem fQr die Cystahionin-gamma-Synthase kodierenden Gen metB, 

h) dem fQr die Cystahionin-gamma-Lyase kodierenden Gen metC, 

i) dem fur die Serin-Hydroxymethyltransferase kodierenden Gen glyA, 

j) dem fQr die O-Acetylhomoserin-Sulfhydrylase kodierenden Gen metY, 

k) dem fQr das metH Gen, das fur die Vitamin B12 abhangige Methionin-Synthase 
kodiert, 

I) dem fur das serC Gen, das fur die Phosphoserin-Aminotransferase kodiert, 

m) dem serB Gen, das fQr die Phosphoserin-Phosphatase kodiert, 

n) dem cysE Gen, das fQr die Serine Acetyl-Transferase kodiert, und 

o) dem horn Gen, das eine Homoserin-Dehydrogenase kodiert, 

uberexprimiertoder so mutiert ist, dass die korrespondierenden Proteine, verglichen mit 
nicht mutierten Proteinen, in geringerem Made Oder nicht durch Stoffwechselmetabolite 
in ihrer Aktivitat beeinflusst werden. 



M/43126 



MetF 



BASF Aktiengesellschl 



20020289 



• 



0000053880 



5 



10 




15 

14. 

20 15. 




30 16. 



Verfahren gemaft einem der vorhergehenden Anspruche, wobei man coryneformen 
Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt unter 

a) dem fOr die Homoserine-Kinase kodierenden Gen thrB, 

b) dem fOr die Threonin Dehydratase kodierenden Gen ilvA, 

c) dem fur die Threonin Synthase kodierenden Gen thrC 

d) dem fur die Meso-Diaminopimelat D-Dehydrogenase kodierenden Gen ddh 

e) dem fur die Phosphoenolpyruvat-Carboxykinase kodierenden Gen pck, 

f) dem fQr die Glucose-6-Phosphat-6-lsomerase kodierenden Gen pgi, 

g) dem fur die Pyruvat-Oxidase kodierenden Gen poxB, 

h) dem fQr die Dihydrodipicolinat Synthase kodiemden Gen dapA, 

i) dem fOr die Dihydrodipicolinat Reduktase kodiemden Gen dapB; oder 
j) dem fOr die Diaminopicolinat Decarboxylase kodiemden Gen 

durch Veranderung derExpressionsrate oderdurch Einfuhrung einergezielten Mutation 
abschwacht ist. 

Verfahren gemSB einem oder mehreren der vorhergehenden AnsprQche, wobei man 
Mikroorganismen der Art Corynebacterium glutamicum einsetzt. 

Verfahren zur Herstellung eines L-Methionin haltigen Tierfuttermittel-Additivs aus 
Fermentationsbriihen, welches folgende Schritte umfasst 

a) Kultivierung und Fermentation eines L-Methionin produzierenden 
Mikroorganismus in einem Fermentationsmedium; 

b) Entfernung von Wasser aus der L-Methionin haltigen Fermentationsbruhe; 

c) Entfernung der wahrend der Fermentation gebildeten Biomasse in einer Menge 
von 0 bis 100 Gew.-%; und 

d) Trocknung der gemafi b) und/oder c) erhaltenen FermentationsbrOhe, urn das 
Tierfuttermittel-Additiv in der gewQnschten Pulver- oder Granulatform zu erhalten. 

Verfahren gemali Anspruch 15, wobei man Mikroorganismen gemalider Definition in 
einem der Anspruche 1 bis 14 einsetzt. 
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Zusammenfassuna 

Die Erfindung betriffi Verfahren zur fermentativen Herstellung von schwefelhaltigen 
Feinchemikalien, insbesondere L-Methionin, unterVerwendung von Bakterien, in denen einefur 
ein Methionin-Synthase (metF)-Gen kodierende Nukleottdsequenzen exprimiert wircL 





1 

SEQUENZ PROTOKOLL 

<110> BASF Aktiengesellschaf t 

<120> MetF 

<130> M/43126 
<140> 

<141> 

<160> 66 

<210> 1 
<211> 984 
<212> DNA 

<213> corynebacterium diphteriae 

<220> 

<221> CDS 

^222> (1) . . (981) 

223> RDI01260 

<400> 1 

atg tct gca caa ccg eta cct get gcg tat cag cgc aca ate ace gat 48 
Met Ser Ala Gin Pro Leu Pro Ala Ala Tyr Gin Arg Thr lie Thr Asp 
15 10 15 

gtc att tec atg cca aca ccg ggc cag gtt ccg ttt tct gta gag ttt 96 
Val lie Ser Met Pro Thr Pro Gly Gin Val Pro Phe Ser Val Glu Phe 
20 25 30 

atg ccg cca cga gat gag gca gca gaa gag cga etc tgg aaa gee gec 144 
Met Pro Pro Arg Asp Glu Ala Ala Glu Glu Arg Leu Trp Lys Ala Ala 
35 40 45 

gaa gca ttt cac gac tta gga gee tct ttt gtc tec gtt act tat ggt 192 
Glu Ala Phe His Asp Leu Gly Ala Ser Phe Val Ser Val Thr Tyr Gly 
50 55 60 

^ca ggc gga tct age cgc gag cgc aca atg cgt gtc gcg cac aag ctt 24 0 
la Gly Gly Ser Ser Arg Glu Arg Thr Met Arg Val Ala His Lys Leu 
65 70 75 80 

tct cgt cat ccg ttg ace acg etc gtt cat etc acg ctt gtg gaa cac 2 88 
Ser Arg His Pro Leu Thr Thr Leu Val His Leu Thr Leu Val Glu His 
85 90 95 

ace caa gaa gaa tta gaa gaa att ctg tgc act tat gcg tec cac ggg 33 6 
Thr Gin Glu Glu Leu Glu Glu He Leu Cys Thr Tyr Ala Ser His Gly 
100 105 110 

ttg tct aac tta ctt gec ttg cga ggc gat ccc cct ggc act gac ccg 3 84 
Leu Ser Asn Leu Leu Ala Leu Arg Gly Asp Pro Pro Gly Thr Asp Pro 
115 120 " 125 

atg get ccg tgg gtc cct ace gca ggc ggc eta gat tat gec aaa gat 432 
Met Ala Pro Trp Val Pro Thr Ala Gly Gly Leu Asp Tyr Ala Lys Asp 
130 135 140 

ttg ate gac etc gtg cgc aag act gag cag ace teg cac ttt cag gta 480 
Leu He Asp Leu Val Arg Lys Thr Glu Gin Thr Ser His Phe Gin Val 
145 150 155 160 



M/43126 



MetF 



gga att get agt ttc cca gaa ggg cac tac cga gcg cct age att gag 528 
Gly lie Ala Ser Phe Pro Glu Gly His Tyr Arg Ala Pro Ser lie Glu 
165 170 175 

gcg gat acg caa ttt aca ttg gaa aag ctg cga get ggc gca gag ttt 57 6 
Ala Asp Thr Gin Phe Thr Leu Glu Lys Leu Arg Ala Gly Ala Glu Phe 
180 185 190 

teg att ace cag atg ttt ttt gat gtc gat cac tat tta cga ctg cga 624 
Ser lie Thr Gin Met Phe Phe Asp Val Asp His Tyr Leu Arg Leu Arg 
195 200 205 

gat cgc ttg gtt aag gcg gat cct gaa cat gga tea aag ccg ate ate 672 
Asp Arg Leu Val Lys Ala Asp Pro Glu His Gly Ser Lys Pro lie lie 
210 215 220 

cca gga ctt atg ccc att ace age ttg agg teg gtt cgt agg cag atg 72 0 
Pro Gly Leu Met Pro lie Thr Ser Leu Arg Ser Val Arg Arg Gin Met 
225 230 235 240 



a tta gca ggt gee ace ttg cct aag get tta gaa aaa egg ctt etc 768 
u Leu Ala Gly Ala Thr Leu Pro Lys Ala Leu Glu Lys Arg Leu Leu 
245 250 255 



gac gca gcg cgc ggc gat gag gaa get cat cgc ggc gat att cgc aaa 816 
Asp Ala Ala Arg Gly Asp Glu Glu Ala His Arg Gly Asp He Arg Lys 
260 265 270 

gta gga ate gaa gtc act act gag atg gca cag cgt ctt att tct gaa 864 
Val Gly He Glu Val Thr Thr Glu Met Ala Gin Arg Leu He Ser Glu 
275 280 285 

ggg ate cca gac ate cat ttc atg ace atg aat tat gtt cga gcg ace 912 
Gly He Pro Asp He His Phe Met Thr Met Asn Tyr Val Arg Ala Thr 
290 295 300 



caa gaa gta etc cat aat etc ggc atg gcg ccc gcg tgg gga aca cag 960 
Gin Glu Val Leu His Asn Leu Gly Met Ala Pro Ala Trp Gly Thr Gin 
305 310 315 " " 320 



• 



a ggc cac gac get att cgc taa 984 
In Gly His Asp Ala He Arg 
325 



<210> 2 
<211> 327 
<212> PRT 

<213> corynebacterium diphteriae 



<400> 2 

Met Ser Ala Gin Pro Leu Pro Ala Ala Tyr Gin Arg Thr He Thr Asp 
1 5 10 15 

Val He Ser Met Pro Thr Pro Gly Gin Val Pro Phe Ser Val Glu Phe 
20 25 30 

Met Pro Pro Arg Asp Glu Ala Ala Glu Glu Arg Leu Trp Lys Ala Ala 
35 40 45 

Glu Ala Phe His Asp Leu Gly Ala Ser Phe Val Ser Val Thr Tyr Gly 
50 55 60 
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MetF 



Ala Gly Gly Ser Ser Arg Glu Arg Thr Met Arg Val Ala His Lys Leu 

65 70 75 80 

Ser Arg His Pro Leu Thr Thr Leu Val His Leu Thr Leu Val Glu His 

85 90 95 

Thr Gin Glu Glu Leu Glu Glu He Leu Cys Thr Tyr Ala Ser His Gly 

100 105 110 

Leu Ser Asn Leu Leu Ala Leu Arg Gly Asp Pro Pro Gly Thr Asp Pro 
115 120 125 

Met Ala Pro Trp Val Pro Thr Ala Gly Gly Leu Asp Tyr Ala Lys Asp 
130 135 140 

Leu He Asp Leu Val Arg Lys Thr Glu Gin Thr Ser His Phe Gin Val 

145 150 155 160 



Gly He Ala Ser Phe Pro Glu Gly His Tyr Arg Ala Pro Ser He Glu 
165 170 175 




a Asp Thr Gin Phe Thr Leu Glu Lys Leu Arg Ala Gly Ala Glu Phe 
180 185 190 

Ser He Thr Gin Met Phe Phe Asp Val Asp His Tyr Leu Arg Leu Arg 
195 200 205 

Asp Arg Leu Val Lys Ala Asp Pro Glu His Gly Ser Lys Pro He He 
210 215 220 

Pro Gly Leu Met Pro He Thr Ser Leu Arg Ser Val Arg Arg Gin Met 
225 230 235 240 

Glu Leu Ala Gly Ala Thr Leu Pro Lys Ala Leu Glu Lys Arg Leu Leu 
245 250 255 

Asp Ala Ala Arg Gly Asp Glu Glu Ala His Arg Gly Asp He Arg Lys 
260 265 270 

^al Gly He Glu Val Thr Thr Glu Met Ala Gin Arg Leu He Ser Glu 
275 280 285 

ly He Pro Asp He His Phe Met Thr Met Asn Tyr Val Arg Ala Thr 
290 295 300 

Gin Glu Val Leu His Asn Leu Gly Met Ala Pro Ala Trp Gly Thr Gin 
305 310 315 320 

Gin Gly His Asp Ala He Arg 
325 



<210> 3 
<211> 924 
<212> DNA 

<213> Streptomyces lividans 

<220> 
<221> CDS 
<222> (1) . . (921) 
<223> RSV00084 



M/43126 



MetF 



<400> 3 

atg gcc etc gga acc gca age acg agg acg gat cgc gec cgc acg gtg 

Met Ala Leu Gly Thr Ala Ser Thr Arg Thr Asp Arg Ala Arg Thr Val 

15 10 15 

cgt gac ate etc gcc acc ggc aag acg acg tac teg ttc gag ttc teg 

Arg Asp lie Leu Ala Thr Gly Lys Thr Thr Tyr Ser Phe Glu Phe Ser 

20 25 30 

gcg ccg aag acg ccc aag ggc gag aag aac etc tgg age gcg ctg egg 

Ala Pro Lys Thr Pro Lys Gly Glu Lys Asn Leu Trp Ser Ala Leu Arg 

35 40 45 

egg gtc gag gcc gtg gcc ccg gac ttc gtc tec gtg acc tac ggc gcc 

Arg Val Glu Ala Val Ala Pro Asp Phe Val Ser Val Thr Tyr Gly Ala 

50 55 60 



S9 C ggc tec acg cgc gcc ggc acg gtc cgc gag acc cag cag ate gtc 
Gly Gly Ser Thr Arg Ala Gly Thr Val Arg Glu Thr Gin Gin lie Val 
65 70 75 80 



c gac acc acg ctg acc ccg gtg gcc cac etc acc gcc gtc gac cac 
a Asp Thr Thr Leu Thr Pro Val Ala His Leu Thr Ala Val Asp His 
85 90 95 



tec gtc gcc gag ctg cgc aac ate ate ggc cag tac gcc gac gcc ggg 

Ser Val Ala Glu Leu Arg Asn He He Gly Gin Tyr Ala Asp Ala Gly 
100 105 110 

ate cgc aac atg ctg gcc gtg cgc ggc gac ccg ccc ggc gac ccg aac 

He Arg Asn Met Leu Ala Val Arg Gly Asp Pro Pro Gly Asp Pro Asn 
115 120 125 

gcc gac tgg ate gcg cac ccc gag ggc ctg acc tac gcg gcc gaa ctg 

Ala Asp Trp He Ala His Pro Glu Gly Leu Thr Tyr Ala Ala Glu Leu 
130 135 140 

gtc agg etc ate aag gag teg gga gac ttc tgc gtc ggc gtc gcc gcc 

Val Arg Leu He Lys Glu Ser Gly Asp Phe Cys Val Gly Val Ala Ala 

145 150 155 160 



c ccc gag atg cac ccg cgc tec gcc gac tgg gac acg gac gtc acg 
e Pro Glu Met His Pro Arg Ser Ala Asp Trp Asp Thr Asp Val Thr 
165 170 ~ * 175 



aac ttc gtc gac aag tgc egg gcc ggc gcc gac tac gcc ate acc cag 

Asn Phe Val Asp Lys Cys Arg Ala Gly Ala Asp Tyr Ala He Thr Gin 

180 185 190 

atg ttc ttc cag ccc gac tec tac etc egg ctg cgc gac egg gtc gcc 

Met Phe Phe Gin Pro Asp Ser Tyr Leu Arg Leu Arg Asp Arg Val Ala 

195 200 205 

gcg gcc ggc tgc gcg acc ccg gtc att ccc gag gtc atg ccg gtg acc 

Ala Ala Gly Cys Ala Thr Pro Val He Pro Glu Val Met Pro Val Thr 

210 215 220 

agt gtg aag atg ctg gag agg ttg ccg aag etc age aac gcc teg ttc 

Ser Val Lys Met Leu Glu Arg Leu Pro Lys Leu Ser Asn Ala Ser Phe 

225 230 235 240 

ccg gcg gag ctg aaa gag egg ate etc aca gcc aag gac gat ccg gcg 

Pro Ala Glu Leu Lys Glu Arg He Leu Thr Ala Lys Asp Asp Pro Ala 

M/43126 



96 

144 

192 

240 

288 

336 

384 

432 

480 

528 

576 

624 

672 

720 

768 

MetF 



5 



245 250 255 

get gta cgc teg ate ggc ate gag ttc gee acg gag ttc tgc gcg egg 816 
Ala Val Arg Ser lie Gly lie Glu Phe Ala Thr Glu Phe Cys Ala Arg 
260 265 270 

ctg ctg gec gag gga gtg cca gga ctg cac ttc ate acg etc aac aac 864 
Leu Leu Ala Glu Gly Val Pro Gly Leu His Phe lie Thr Leu Asn Asn 
275 280 285 

tec acg gcg acg ctg gaa ate tac gag aac ctg ggc ctg cac cac cca 912 
Ser Thr Ala Thr Leu Glu He Tyr Glu Asn Leu Gly Leu His His Pro 
290 295 300 

ccg egg gee tag 924 

Pro Arg Ala 

305 




<210> 4 
211> 307 
12 > PRT 

13 > Strep tomyces lividans 
<400> 4 

Met Ala Leu Gly Thr Ala Ser Thr Arg Thr Asp Arg Ala Arg Thr Val 
15 10 15 

Arg Asp He Leu Ala Thr Gly Lys Thr Thr Tyr Ser Phe Glu Phe Ser 
20 25 30 

Ala Pro Lys Thr Pro Lys Gly Glu Lys Asn Leu Trp Ser Ala Leu Arg 
35 40 45 

Arg Val Glu Ala Val Ala Pro Asp Phe Val Ser Val Thr Tyr Gly Ala 
50 55 60 

Gly Gly Ser Thr Arg Ala Gly Thr Val Arg Glu Thr Gin Gin He Val 
65 70 75 80 



m 



la Asp Thr Thr Leu Thr Pro Val Ala His Leu Thr Ala Val Asp His 
85 90 95 



er Val Ala Glu Leu Arg Asn lie He Gly Gin Tyr Ala Asp Ala Gly 

100 105 110 

He Arg Asn Met Leu Ala Val Arg Gly Asp Pro Pro Gly Asp Pro Asn 

115 120 125 

Ala Asp Trp He Ala His Pro Glu Gly Leu Thr Tyr Ala Ala Glu Leu 

130 135 140 

Val Arg Leu He Lys Glu Ser Gly Asp Phe Cys Val Gly Val Ala Ala 

145 150 155 160 

Phe Pro Glu Met His Pro Arg Ser Ala Asp Trp Asp Thr Asp Val Thr 

165 170 175 

Asn Phe Val Asp Lys Cys Arg Ala Gly Ala Asp Tyr Ala He Thr Gin 

180 185 190 

Met Phe Phe Gin Pro Asp Ser Tyr Leu Arg Leu Arg Asp Arg Val Ala 

195 200 205 

M/43126 ' MetF 




Ala Ala Gly Cys Ala Thr Pro Val lie Pro Glu Val Met Pro Val Thr 
210 215 220 

Ser Val Lys Met Leu Glu Arg Leu Pro Lys Leu Ser Asn Ala Ser Phe 
225 230 235 240 

Pro Ala Glu Leu Lys Glu Arg lie Leu Thr Ala Lys Asp Asp Pro Ala 
245 250 255 

Ala Val Arg Ser He Gly He Glu Phe Ala Thr Glu Phe Cys Ala Arg 
260 265 270 

Leu Leu Ala Glu Gly Val Pro Gly Leu His Phe He Thr Leu Asn Asn 
275 280 285 

Ser Thr Ala Thr Leu Glu He Tyr Glu Asn Leu Gly Leu His His Pro 
290 295 300 

Pro Arg Ala 
05 



<210> 5 
<211> 924 
<212> DNA 

<213> Streptomyces coelicolor 

<220> 

<221> CDS 

<222> (1) . . (921) 

<223> RSX01699 



<400> 5 
atg gcc 
Met Ala 
1 


etc 
Leu 


gga 
Gly 


ace 
Thr 
5 


gca 
Ala 


age 
Ser 


acg agg 
Thr Arg 


acg gat cgc gcc 
Thr Asp Arg Ala 
10 


cgc 
Arg 


acg 
Thr 
15 


gtg 
val 


48 


cgt 
Arg 


gac 
Asp 


ate 
He 


etc 
Leu 
20 


gcc 
Ala 


ace 
Thr 


ggc 
Gly 


aag 
Lys 


acg 
Thr 
25 


acg 
Thr 


tac 
Tyr 


teg 
Ser 


ttc 
Phe 


gag 
Glu 
30 


ttc 
Phe 


teg 
Ser 


96 


£la 


ccg 
Pro 


aag 
Lys 
35 


acg 
Thr 


ccc 
Pro 


aag 
Lys 


ggc 
Gly 


gag 
Glu 
40 


agg 
Arg 


aac 
Asn 


etc 
Leu 


tgg 
Trp 


age 
Ser 
45 


gcg 
Ala 


ctg 
Leu 


egg 
Arg 


144 


egg 
Arg 


gtc 
Val 
50 


gag 
Glu 


gcc 
Ala 


gtg 

Val 


gcc 
Ala 


ccg 
Pro 
55 


gac 
Asp 


ttc 
Phe 


gtc 
Val 


tec 
Ser 


gtg 
Val 
60 


acc 
Thr 


tac 
Tyr 


ggc 
Gly 


gcc 
Ala 


192 


ggc 
Gly 
65 


ggc 
Gly 


tec 
Ser 


acg 
Thr 


cgc 
Arg 


gcc 
Ala 
70 


3gc 
Gly 


acg 
Thr 


gtc 
Val 


cgc 
Arg 


gag 
Glu 
75 


acc 
Thr 


cag 
Gin 


cag 
Gin 


ate 
He 


gtc 
Val 
80 


240 


gcc 
Ala 


gac 
Asp 


ace 
Thr 


acg 
Thr 


ctg 
Leu 


ace 
Thr 


ccg 
Pro 


gtg 
Val 


gcc 
Ala 


cac 
His 


etc 
Leu 


acc 
Thr 


gcc 
Ala 


gtc 
Val 


gac 
Asp 


cac 
His 


288 



85 90 95 



tec gtc gcc gag ctg cgc aac ate ate ggc cag tac gcc gac gcc ggg 33 6 

Ser Val Ala Glu Leu Arg Asn He He Gly Gin Tyr Ala Asp Ala Gly 

100 105 110 

ate cgc aac atg ctg gcc gtg cgc ggc gac ccg ccc ggc gac ccg aac 3 84 

M/43126 MetF 




He Arg Asn Met Leu Ala Val Arg Gly Asp Pro Pro Gly Asp Pro Asn 

115 120 * ~ 125 

gcc gac tgg ate gcg cac ccc gag ggc ctg acc tac gcg gec gaa ctg 

Ala Asp Trp He Ala His Pro Glu Gly Leu Thr Tyr Ala Ala Glu Leu 

130 135 140 

gtc agg etc ate aag gag teg ggc gac ttc tgc gtc ggc gtc gcg gcc 

Val Arg Leu He Lys Glu Ser Gly Asp Phe Cys Val Gly Val Ala Ala 

145 150 155 160 

ttc ccc gag atg cac ccg cgc tec gcc gac tgg gac acg gac gtc acg 

Phe Pro Glu Met His Pro Arg Ser Ala Asp Trp Asp Thr Asp Val Thr 

165 170 175 

aac ttc gtc gac aag tgc egg gcc ggc gcc gac tac gcc ate acc cag 

Asn Phe Val Asp Lys Cys Arg Ala Gly Ala Asp Tyr Ala He Thr Gin 

180 185 190 




atg ttc ttc cag ccc gac tec tat etc egg ctg cgc gac egg gtc gcc 

et Phe Phe Gin Pro Asp Ser Tyr Leu Arg Leu Arg Asp Arg Val Ala 
195 200 205 

gcg gcc ggc tgc gcg acc ccg gtc ate ccc gag gtc atg ccg gtg acc 

Ala Ala Gly Cys Ala Thr Pro Val He Pro Glu Val Met Pro Val Thr 
210 215 220 

agt gtg aag atg ctg gag agg ttg ccg aag etc age aac gcc teg ttc 

Ser Val Lys Met Leu Glu Arg Leu Pro Lys Leu Ser Asn Ala Ser Phe 

225 230 235 240 

ccg gcg gag ttg aaa gag egg ate etc aca gcc aag gac gat ccg gcg 

Pro Ala Glu Leu Lys Glu Arg He Leu Thr Ala Lys Asp Asp Pro Ala 
245 250 255 

get gta cgc teg ate ggc ate gag ttc gcc acg gag ttc tgc gcg egg 

Ala Val Arg Ser He Gly He Glu Phe Ala Thr Glu Phe Cys Ala Arg 
260 265 270 



tg ctg gcc gag gga gtg cca gga ctg cac ttc ate acg etc aac aac 
u Leu Ala Glu Gly Val Pro Gly Leu His Phe He Thr Leu Asn Asn 
275 280 285 



tec acg gcg acg ctg gaa ate tac gag aac ctg ggc ctg cac cac cca 
Ser Thr Ala Thr Leu Glu He Tyr Glu Asn Leu Gly Leu His His Pro 
290 295 300 

ccg egg gcc tag 
Pro Arg Ala 
305 



<210> 6 
<211> 307 
<212> PRT 

<213> Streptomyces coelicolor 
<400> 6 

Met Ala Leu Gly Thr Ala Ser Thr Arg Thr Asp Arg Ala Arg Thr Val 
15 10 15 

Arg Asp He Leu Ala Thr Gly Lys Thr Thr Tyr Ser Phe Glu Phe Ser 
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432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 



924 



MetF 




20 25 30 

Ala Pro Lys Thr Pro Lys Gly Glu Arg Asn Leu Trp Ser Ala Leu Arg 
35 40 ~ 45 

Arg Val Glu Ala Val Ala Pro Asp Phe Val Ser Val Thr Tyr Gly Ala 
50 55 60 

Gly Gly Ser Thr Arg Ala Gly Thr Val Arg Glu Thr Gin Gin He Val 
65 70 75 80 

Ala Asp Thr Thr Leu Thr Pro Val Ala His Leu Thr Ala Val Asp His 
85 90 95 

Ser Val Ala Glu Leu Arg Asn He He Gly Gin Tyr Ala Asp Ala Gly 
100 105 110 

He Arg Asn Met Leu Ala Val Arg Gly Asp Pro Pro Gly Asp Pro Asn 
115 120 125 

la Asp Trp He Ala His Pro Glu Gly Leu Thr Tyr Ala Ala Glu Leu 
130 135 140 

Val Arg Leu He Lys Glu Ser Gly Asp Phe Cys Val Gly Val Ala Ala 
145 150 155 160 

Phe Pro Glu Met His Pro Arg Ser Ala Asp Trp Asp Thr Asp Val Thr 
165 170 175 

Asn Phe Val Asp Lys Cys Arg Ala Gly Ala Asp Tyr Ala He Thr Gin 
180 185 190 

Met Phe Phe Gin Pro Asp Ser Tyr Leu Arg Leu Arg Asp Arg Val Ala 
195 200 205 

Ala Ala Gly Cys Ala Thr Pro Val He Pro Glu Val Met Pro Val Thr 
210 215 220 



Ser Val Lys Met Leu Glu Arg Leu Pro Lys Leu Ser Asn Ala Ser Phe 
225 230 235 240 



o Ala Glu Leu Lys Glu Arg He Leu Thr Ala Lys Asp Asp Pro Ala 
245 250 255 



Ala Val Arg Ser He Gly He Glu Phe Ala Thr Glu Phe Cys Ala Arg 
260 265 270 

Leu Leu Ala Glu Gly Val Pro Gly Leu His Phe He Thr Leu Asn Asn 
275 280 285 

Ser Thr Ala Thr Leu Glu He Tyr Glu Asn Leu Gly Leu His His Pro 
290 295 300 

Pro Arg Ala 
305 



<210> 7 
<211> 891 
<212> DNA 

<213> Aquifex aeolicus 
<220> 



M/43126 



MetF 




<221> CDS 

<222> (1) . . (888) 

<223> RAA00346 

<400> 7 

atg aaa at a gga gat at a ctg agg aaa gga gtt ttc agt att tct ttt 48 

Met Lys He Gly Asp He Leu Arg Lys Gly Val Phe Ser He Ser Phe 

15 10 15 

gag ttc ttt cca ccg aag act gaa gag gga gaa aga cag etc ttt gaa 96 
Glu Phe Phe Pro Pro Lys Thr Glu Glu Gly Glu Arg Gin Leu Phe Glu 
20 25 30 

act ata agg aaa ctt gag aaa tta aat cct act ttt gta tec gtt act 144 
Thr He Arg Lys Leu Glu Lys Leu Asn Pro Thr Phe Val Ser Val Thr 
35 40 45 

tac ggg gca ggt ggt teg act aga gat aga act agg aat ata gta cag 192 
Tyr Gly Ala Gly Gly Ser Thr Arg Asp Arg Thr Arg Asn He Val Gin 
50 55 60 

a ata cac gag gaa act aac etc acc gtt atg gca cac etc acc tgt 240 
s He His Glu Glu Thr Asn Leu Thr Val Met Ala His Leu Thr Cys 
65 70 75 80 

ata gca cac acg aga gag gag ctt att gat ate ctt caa gat tac aaa 288 
He Ala His Thr Arg Glu Glu Leu He Asp He Leu Gin Asp Tyr Lys 
85 90 95 

aac ata ggt ata gag aac att etc get ttg agg ggg gac gtt ccg agg 336 
Asn He Gly He Glu Asn He Leu Ala Leu Arg Gly Asp Val Pro Arg 
100 105 110 

gac aaa ccg gac tgg aga ccg ccg aag ggt gcg tgc aag tat gca aaa 384 
Asp Lys Pro Asp Trp Arg Pro Pro Lys Gly Ala Cys Lys Tyr Ala Lys 
115 120 125 

gag etc gta gaa ctg ate agg aag gag ttc gga gac tgg ttt tct ate 432 
Glu Leu Val Glu Leu He Arg Lys Glu Phe Gly Asp Trp Phe Ser He 
130 135 140 



a gtg get tct tat cct gaa gga cat ccg gaa tea ccg aac etc gag 480 
y Val Ala Ser Tyr Pro Glu Gly His Pro Glu Ser Pro Asn Leu Glu 



145 150 155 160 

tgg gaa gtg aag tac ttt aag gaa aag gta gag gca ggt gca gac ttc 528 
Trp Glu Val Lys Tyr Phe Lys Glu Lys Val Glu Ala Gly Ala Asp Phe 
165 170 " 175 

teg att act cag atg ttt ttc gtg aac gat tac tac tac agg ttt gtg 576 
Ser He Thr Gin Met Phe Phe Val Asn Asp Tyr Tyr Tyr Arg Phe Val 
180 185 190 

gaa atg tgc aaa aat gca ggg ata gat ata tct ata att ccg gga att 624 
Glu Met Cys Lys Asn Ala Gly He Asp He Ser He He Pro Gly He 
195 200 205 

atg cct att act aac ttc aaa cag ata aga aag ttt get tct ctt tgc 672 
Met Pro He Thr Asn Phe Lys Gin He Arg Lys Phe Ala Ser Leu Cys 
210 215 220 

gga gcg acg att cca cag agt ctt ata gaa aag ctt gaa aaa gtg gag 720 
Gly Ala Thr He Pro Gin Ser Leu He Glu Lys Leu Glu Lys Val Glu 

M/43126 MetF 



225 230 . 235 240 

gat aaa ccg gaa gaa gta aaa aag at a ggg att gag ttt gcc at a aat 768 
Asp Lys Pro Glu Glu Val Lys Lys lie Gly He Glu Phe Ala He Asn 
245 250 255 

cag tgt ttg gat etc ata gaa cac gga gtt ccg ggg ctt cac ttc tac 816 
Gin Cys Leu Asp Leu He Glu His Gly Val Pro Gly Leu His Phe Tyr 
260 265 270 

act ctg aac aag tec gac gca act ttg aag ata tac gag get ata aag 864 
Thr Leu Asn Lys Ser Asp Ala Thr Leu Lys He Tyr Glu Ala He Lys 
275 280 285 

gat aaa ata ccg gcc cgt tea act taa 891 
Asp Lys He Pro Ala Arg Ser Thr 
290 295 




<210> 8 
211> 296 
12 > PRT 

13 > Aquifex aeolicus 
<400> 8 

Met Lys He Gly Asp He Leu Arg Lys Gly Val Phe Ser He Ser Phe 
15 10 15 

Glu Phe Phe Pro Pro Lys Thr Glu Glu Gly Glu Arg Gin Leu Phe Glu 
20 25 30 

Thr He Arg Lys Leu Glu Lys Leu Asn Pro Thr Phe Val Ser Val Thr 
35 40 45 

Tyr Gly Ala Gly Gly Ser Thr Arg Asp Arg Thr Arg Asn He Val Gin 
50 55 60 

Lys He His Glu Glu Thr Asn Leu Thr Val Met Ala His Leu Thr Cys 
65 70 75 80 



le Ala His Thr Arg Glu Glu Leu He Asp He Leu Gin Asp Tyr Lys 
85 90 95 



n He Gly He Glu Asn He Leu Ala Leu Arg Gly Asp Val Pro Arg 

100 105 ~ ~ 110 

Asp Lys Pro Asp Trp Arg Pro Pro Lys Gly Ala Cys Lys Tyr Ala Lys 

115 12 0 125 

Glu Leu Val Glu Leu He Arg Lys Glu Phe Gly Asp Trp Phe Ser He 

13 0 13 5 14 0 

Gly Val Ala Ser Tyr Pro Glu Gly His Pro Glu Ser Pro Asn Leu Glu 

145 150 155 160 

Trp Glu Val Lys Tyr Phe Lys Glu Lys Val Glu Ala Gly Ala Asp Phe 

165 170 175 

Ser He Thr Gin Met Phe Phe Val Asn Asp Tyr Tyr Tyr Arg Phe Val 

180 185 * 190 

Glu Met Cys Lys Asn Ala Gly He Asp He Ser He He Pro Gly He 

195 200 205 
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11 



Met Pro lie Thr Asn Phe Lys Gin He Arg Lys Phe Ala Ser Leu Cys 
210 215 220 

Gly Ala Thr He Pro Gin Ser Leu He Glu Lys Leu Glu Lys Val Glu 
225 230 235 240 

Asp Lys Pro Glu Glu Val Lys Lys He Gly He Glu Phe Ala* He Asn 
245 250 255 

Gin Cys Leu Asp Leu He Glu His Gly Val Pro Gly Leu His Phe Tyr 
260 265 270 

Thr Leu Asn Lys Ser Asp Ala Thr Leu Lys He Tyr Glu Ala He Lys 
275 280 285 

Asp Lys He Pro Ala Arg Ser Thr 
290 295 



,210> 9 
11> 831 
12 > DNA 
<213> Burkholderia cepacia 

<220> 

<221> CDS 

<222> (1) . . (828) 

<223> RBU14992 

<400> 9 

atg aac ccg ate gaa ctt tea ttc gaa ttc ttc ccg ccg aaa acg cag 48 

Met Asn Pro He Glu Leu Ser Phe Glu Phe Phe Pro Pro Lys Thr Gin 
15 10 15 

gaa ggc gtg gac aag ctg cgc gec acg cgc gec cag etc gec acg etc 96 
Glu Gly Val Asp Lys Leu Arg Ala Thr Arg Ala Gin Leu Ala Thr Leu 
20 25 30 



ag ccc aag ttc gtg tec gtc acg ttc ggc gee ggc ggc teg acg caa 144 
Pro Lys Phe Val Ser Val Thr Phe Gly Ala Gly Gly Ser Thr Gin 
35 40 45 



cag ggc acg etc gac acc gtc gtc gat atg gcg aag gaa ggg etc gaa 192 
Gin Gly Thr Leu Asp Thr Val Val Asp Met Ala Lys Glu Gly Leu Glu 
50 55 60 

gcg gcg ccg cac gtg teg tgc ate ggc teg teg aaa gag age ctg cgc 240 
Ala Ala Pro His Val Ser Cys He Gly Ser Ser Lys Glu Ser Leu Arg 
65 70 75 80 

gec att etc aac gag tac cgc gca cat ggc ate cgc cat ate gtc gcg 2 88 

Ala He Leu Asn Glu Tyr Arg Ala His Gly He Arg His He Val Ala 
85 90 95 

ctg cgc ggc gat ctg ccg tec ggc atg ggc gaa gtc ggc gag ctg cgc 33 6 
Leu Arg Gly Asp Leu Pro Ser Gly Met Gly Glu Val Gly Glu Leu Arg 
100 105 110 

tat gcg teg gaa ctg gtg age ttt ate cgc gee gaa ttc ggc gac tgg 3 84 
Tyr Ala Ser Glu Leu Val Ser Phe He Arg Ala Glu Phe Gly Asp Trp 
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115 120 125 

ttc tgc ate gag gtg gec ggc tat ccg gaa tac cac ccg cag teg cgc 432 

Phe Cys lie Glu Val Ala Gly Tyr Pro Glu Tyr His Pro Gin Ser Arg 
130 135 140 

teg ccg cgt cag gat ctg gaa aac ttc gee cgc aag gtg aag gec ggc 480 

Ser Pro Arg Gin Asp Leu Glu Asn Phe Ala Arg Lys Val Lys Ala Gly 

145 150 155 160 

gec aat teg gcg ate aca cag tac ttc ttc aat gca gac gcg tat ttc 528 

Ala Asn Ser Ala lie Thr Gin Tyr Phe Phe Asn Ala Asp Ala Tyr Phe 
165 170 175 

cgt ttc gtc gac gac gcg aga aag etc ggc gtg gac gtg ccg ate gtg 576 

Arg Phe Val Asp Asp Ala Arg Lys Leu Gly Val Asp Val Pro lie Val 

180 185 190 



ccg ggc ate atg ccg ate acg aac ttc teg cag ctg atg cgt ttc teg 624 
Pro Gly lie Met Pro lie Thr Asn Phe Ser Gin Leu Met Arg Phe Ser 
195 200 205 




g atg tgc ggc get gaa gtg cca cgc tgg ate gcg cgc egg ctg gaa 672 
Glu Met Cys. Gly Ala Glu Val Pro Arg Trp lie Ala Arg Arg Leu Glu 
210 215 220 

age ttc ggc gac gat cgc gag tea att cgc gcg ttc ggg ctg gat gtg 72 0 
Ser Phe Gly Asp Asp Arg Glu Ser lie Arg Ala Phe Gly Leu Asp Val 
225 230 235 240 

gtg acg gac ctg tgc agg cgt ctg ate gat gcg aag gtg ccg ggc ctg 768 
Val Thr Asp Leu Cys Arg Arg Leu lie Asp Ala Lys Val Pro Gly Leu 
245 250 255 

cac ttc tac acg eta aac ggc gca gcg gcg ace aag gcg ate tgc gaa 816 
His Phe Tyr Thr Leu Asn Gly Ala Ala Ala Thr Lys Ala lie Cys Glu 
260 265 270 

c gg ttg aac gtt taa 831 
Arg Leu Asn Val 
275 



<210> 10 
<211> 276 
<212> PRT 

<213> Burkholderia cepacia 



<400> 10 

Met Asn Pro lie Glu Leu Ser Phe Glu Phe Phe Pro Pro Lys Thr Gin 
15 10 15 

Glu Gly Val Asp Lys Leu Arg Ala Thr Arg Ala Gin Leu Ala Thr Leu 
20 25 30 

Lys Pro Lys Phe Val Ser Val Thr Phe Gly Ala Gly Gly Ser Thr Gin 
35 40 45 



Gin Gly Thr Leu Asp Thr Val Val Asp Met Ala Lys Glu Gly Leu Glu 
50 55 60 



Ala Ala Pro His Val Ser Cys lie Gly Ser Ser Lys Glu Ser Leu Arg 
M/43126 



MetF 




13 



65 70 75 80 

Ala lie Leu Asn Glu Tyr Arg Ala His Gly lie Arg His lie Val Ala 
85 90 95 

Leu Arg Gly Asp Leu Pro Ser Gly Met Gly Glu Val Gly Glu Leu Arg 
100 105 110 

Tyr Ala Ser Glu Leu Val Ser Phe lie Arg Ala Glu Phe Gly Asp Trp 
115 120 125 

Phe Cys He Glu Val Ala Gly Tyr Pro Glu Tyr His Pro Gin Ser Arg 
130 135 140 

Ser Pro Arg Gin Asp Leu Glu Asn Phe Ala Arg Lys Val Lys Ala Gly 
145 150 155 160 

Ala Asn Ser Ala He Thr Gin Tyr Phe Phe Asn Ala Asp Ala Tyr Phe 
165 170 175 

g Phe Val Asp Asp Ala Arg Lys Leu Gly Val Asp Val Pro He Val 
180 185 190 

Pro Gly He Met Pro He Thr Asn Phe Ser Gin Leu Met Arg Phe Ser 
195 200 205 

Glu Met Cys Gly Ala Glu Val Pro Arg Trp He Ala Arg Arg Leu Glu 
210 215 220 

Ser Phe Gly Asp Asp Arg Glu Ser He Arg Ala Phe Gly Leu Asp Val 
225 230 235 240 

Val Thr Asp Leu Cys Arg Arg Leu He Asp Ala Lys Val Pro Gly Leu 
245 250 255 

His Phe Tyr Thr Leu Asn Gly Ala Ala Ala Thr Lys Ala He Cys Glu 
260 265 270 

Arg Leu Asn Val 





275 


Beio> 


11 


<211> 


846 


<212> 


DNA 


<213> 


Nitrosomonas i 


<220> 




<221> 


CDS 


<222> 


(1) . . (843) 


<223> 


RNE02657 


<400> 


11 


atg caa tec cag aaa 


Met Gin Ser Gin Lys 


1 


5 



10 15 



48 



ccg ccg cag aca ccg gaa ggc atg gaa aag ctg egg gca acg cgc ata 96 
Pro Pro Gin Thr Pro Glu Gly Met Glu Lys Leu Arg Ala Thr Arg He 
20 25 30 



cag ctt get cag ttc aat ccg aag ttt ttt teg gtg acg ttt ggt gec 



M/43126 



144 

MetF 





Gin Leu Ala Gin Phe Asn Pro Lys Phe Phe Ser Val Thr Phe Gly Ala 
35 40 45 

ggc gga tec act cgt gaa cgc acg etc gaa acc gtg ctg gaa att cag 192 
Gly Gly Ser Thr Arg Glu Arg Thr Leu Glu Thr Val Leu Glu He Gin 
50 55 60 

gca gaa ggc tat ccg gta gcg ccc cat ctt tec tgt ate ggc tec acg 24 0 
Ala Glu Gly Tyr Pro Val Ala Pro His Leu Ser Cys He Gly Ser Thr 
65 70 75 80 

cgt gac aat ate cgt teg ate ctt gag aaa tat cac agt cac ggt ate 2 88 
Arg Asp Asn He Arg Ser He Leu Glu Lys Tyr His Ser His Gly He 
85 90 95 

age cgc att gtg gcg eta cgt ggt gat tta ccc tec ggc atg gcg cag 336 
Ser Arg He Val Ala Leu Arg Gly Asp Leu Pro Ser Gly Met Ala Gin 
100 105 110 

gcg gga gaa ttc cgc tac gec aac gag ctg gta gca ttt ate cgc aag 384 
Ja Gly Glu Phe Arg Tyr Ala Asn Glu Leu Val Ala Phe He Arg Lys 
115 120 125 

gag ttc ggt gat acc ttc tgg ate gaa gtg gcg get tat ccg gaa tat 432 
Glu Phe Gly Asp Thr Phe Trp He Glu Val Ala Ala Tyr Pro Glu Tyr 
130 135 140 

cat cca caa gec cgc tec get ctg gag gat ttc acc aat ttc aga cga 480 
His Pro Gin Ala Arg Ser Ala Leu Glu Asp Phe Thr Asn Phe Arg Arg 
145 150 ' 155 160 

aaa gtc gaa gca ggt tec aat gca gcg att acc cag ttt ttc tat aac 52 8 
Lys Val Glu Ala Gly Ser Asn Ala Ala He Thr Gin Phe Phe Tyr Asn 
165 170 175 

gtg gat gee tat ctg cat ttc gta gag atg tgt gaa get gcg gat ctg 576 
Val Asp Ala Tyr Leu His Phe Val Glu Met Cys Glu Ala Ala Asp Leu 
180 185 190 

at ate ccg ate gtt ccc ggc ate atg ccg ate age aaa ttt tct caa 624 
n He Pro He Val Pro Gly He Met Pro He Ser Lys Phe Ser Gin 
195 200 205 

ctg gca aga ttt teg gat ggc tgt gga gca gaa att cca cgc tgg att 672 
Leu Ala Arg Phe Ser Asp Gly Cys Gly Ala Glu He Pro Arg Trp He 
210 215 220 

cgc aga aaa ctg gaa age ttc ggt gat gat att ccg tct ate cag gca 720 
Arg Arg Lys Leu Glu Ser Phe Gly Asp Asp He Pro Ser He Gin Ala 
225 230 235 240 

ttc ggg ctg gat gtc gtc aca gcg tta tgt get cgt ctg ctg gaa gec 7 68 
Phe Gly Leu Asp Val Val Thr Ala Leu Cys Ala Arg Leu Leu Glu Ala 
245 250 255 

ggc gca ccc ggc ctg cat ttc tac aca etc aac tec gee gta eta ccc 816 
Gly Ala Pro Gly Leu His Phe Tyr Thr Leu Asn Ser Ala Val Leu Pro 
260 265 270 

aca aaa ate tgg caa cgc ctg ggg tta tag 846 
Thr Lys He Trp Gin Arg Leu Gly Leu 
275 280 

M/43126 MetF 
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<210> 12 
<211> 281 
<212> PRT 

<213> Nitrosomonas europaea 
<400> 12 

Met Gin Ser Gin Lys Lys Phe Thr Pro Thr Phe Ser Phe Glu Phe Phe 
15 10 15 

Pro Pro Gin Thr Pro Glu Gly Met Glu Lys Leu Arg Ala Thr Arg lie 
20 25 ~ 30 

Gin Leu Ala Gin Phe Asn Pro Lys Phe Phe Ser Val Thr Phe Gly Ala 
35 40 45 

Gly Gly Ser Thr Arg Glu Arg Thr Leu Glu Thr Val Leu Glu lie Gin 
50 55 60 



m 



la Glu Gly Tyr Pro Val Ala Pro His Leu Ser Cys lie Gly Ser Thr 
5 70 75 80 




Arg Asp Asn lie Arg Ser lie Leu Glu Lys Tyr His Ser His Gly lie 
85 90 95 

Ser Arg He Val Ala Leu Arg Gly Asp Leu Pro Ser Gly Met Ala Gin 
100 105 110 

Ala Gly Glu Phe Arg Tyr Ala Asn Glu Leu Val Ala Phe He Arg Lys 
115 120 125 

Glu Phe Gly Asp Thr Phe Trp He Glu Val Ala Ala Tyr Pro Glu Tyr 
130 135 140 

His Pro Gin Ala Arg Ser Ala Leu Glu Asp Phe Thr Asn Phe Arg Arg 
145 150 155 160 

Lys Val Glu Ala Gly Ser Asn Ala Ala He Thr Gin Phe Phe Tyr Asn 
165 170 175 

jal Asp Ala Tyr Leu His Phe Val Glu Met Cys Glu Ala Ala Asp Leu 
180 185 190 

Asn He Pro He Val Pro Gly He Met Pro He Ser Lys Phe Ser Gin 
195 200 205 

Leu Ala Arg Phe Ser Asp Gly Cys Gly Ala Glu He Pro Arg Trp He 
210 215 220 

Arg Arg Lys Leu Glu Ser Phe Gly Asp Asp He Pro Ser He Gin Ala 
225 230 235 240 

Phe Gly Leu Asp Val Val Thr Ala Leu Cys Ala Arg Leu Leu Glu Ala 
245 250 255 

Gly Ala Pro Gly Leu His Phe Tyr Thr Leu Asn Ser Ala Val Leu Pro 
260 265 270 

Thr Lys He Trp Gin Arg Leu Gly Leu 
275 280 
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<210> 13 
<21X> 873 
<212> DNA 

<213> Pseudomonas aeruginosa 

<220> 
<221> CDS 
<222> (1) . . (870) 
<223> RPA03308 

<400> 13 

gtg gtc gcg tec aag gaa ccg ate atg agt cag age gaa cgc cgt ttc 4 8 
Val Val Ala Ser Lys Glu Pro lie Met Ser Gin Ser Glu Arg Arg Phe 
15 10 15 

age ttc gag ttc ttc ccg gcg aag ace gag gec ggc cat gaa aag ctg 96 
Ser Phe Glu Phe Phe Pro Ala Lys Thr Glu Ala Gly His Glu Lys Leu 
20 25 30 

ttg gec ace gec cgc aac ctg gcg ggc tac aag ccc gac ttc ttc tec 144 
eu Ala Thr Ala Arg Asn Leu Ala Gly Tyr Lys Pro Asp Phe Phe Ser 
35 40 45 

tgc acc tac ggc gee ggc gga tec acc cgc gac cgc acg ttg agt acc 192 
Cys Thr Tyr Gly Ala Gly Gly Ser Thr Arg Asp Arg Thr Leu Ser Thr 
50 55 60 

gtg ctg caa ctg gac ggc gag gtg aag gtg ccg acc gcg ccg cac ctg 240 
Val Leu Gin Leu Asp Gly Glu Val Lys Val Pro Thr Ala Pro His Leu 
65 70 75 80 

tec tgt gtc ggc gac teg aaa gec gag ttg cgc gaa ctg etc ggc cgc 288 
Ser Cys Val Gly Asp Ser Lys Ala Glu Leu Arg Glu Leu Leu Gly Arg 
85 90 95 

tac cgc gag gee ggc ate cgc cgc ate gtc gee ctg cgc ggc gac ctg .336 
Tyr Arg Glu Ala Gly lie Arg Arg He Val Ala Leu Arg Gly Asp Leu 
100 105 ~ 110 

ccg teg ggc atg ggc atg gee age ggc gaa ctg cgc tac gee aac gaa 3 84 
ro Ser Gly Met Gly Met Ala Ser Gly Glu Leu Arg Tyr Ala Asn Glu 
115 120 125 

ctg gtg gac ttc ate cgc acc gag acc ggc gac cac ttc cac ate gag 432 
Leu Val Asp Phe He Arg Thr Glu Thr Gly Asp His Phe His He Glu 
130 135 140 

gtc gee gee tat ccg gag gtc cac ccc cag gcg cgc age ttc gag gat 480 
Val Ala Ala Tyr Pro Glu Val His Pro Gin Ala Arg Ser Phe Glu Asp 
145 150 155 160 

gac ctg gcg aac ttc gtg cgc aag gtg aag gee ggc gee age age gee 528 
Asp Leu Ala Asn Phe Val Arg Lys Val Lys Ala Gly Ala Ser Ser Ala 
165 170 175 

ate acc cag tac ttc ttc aac gee gat gee tat ttc tac ttc gtc gag 576 
He Thr Gin Tyr Phe Phe Asn Ala Asp Ala Tyr Phe Tyr Phe Val Glu 
180 185 190 

c gg gtc gee aag etc ggc gtg gac ate ccg gtg gtc ccc ggc ate atg 624 
Arg Val Ala Lys Leu Gly Val Asp He Pro Val Val Pro Gly He Met 
195 200 205 



M/43126 
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ccg ate acc aac tac tec aag ctg gcg cgc ttc tec gac gee tgc ggc 672 

Pro He Thr Asn Tyr Ser Lys Leu Ala Arg Phe Ser Asp Ala Cys Gly 

210 215 220 

gee gaa ctg ccg cgc tgg ate cgc aag caa ctg gaa gee tac ggc gac 720 

Ala Glu Leu Pro Arg Trp He Arg Lys Gin Leu Glu Ala Tyr Gly Asp 

225 230 235 240 

gac age cgc age ate cag gec ttc ggc gag cag gtc ate age gag atg 768 

Asp Ser Arg Ser He Gin Ala Phe Gly Glu Gin Val He Ser Glu Met 

245 250 255 

tgc gaa cgc ctg ctg gag ggc ggc gca ccg gga ctg cat ttc tat act 816 

Cys Glu Arg Leu Leu Glu Gly Gly Ala Pro Gly Leu His Phe Tyr Thr 

260 265 270 

ttg aac cag gee gat ccg age ctg gcg ate tgg aag aat etc cag ctg 864 

Leu Asn Gin Ala Asp Pro Ser Leu Ala He Trp Lys Asn Leu Gin Leu 

275 280 285 



a cgc tga 8 73 

o Arg 
290 



<210> 14 

<211> 290 

<212> PRT 

<213> Pseudomonas aeruginosa 



<400> 14 



Val 
1 


Val 


Ala 


Ser 


Lys 
5 


Glu 


Pro 


He Met Ser 
10 


Gin 


Ser Glu Arg Arg Phe 
15 


Ser 


Phe 


Glu 


Phe 
20 


Phe 


Pro 


Ala 


Lys Thr Glu 
25 


Ala 


Gly His 


Glu Lys Leu 
30 


Leu 


Ala 


Thr 
35 


Ala 


Arg 


Asn 


Leu 


Ala Gly Tyr 
40 


Lys 


Pro Asp 
45 


Phe Phe Ser 




Thr 
50 


Tyr 


Gly 


Ala 


Gly 


Gly 
55 


Ser Thr Arg Asp Arg Thr Leu Ser Thr 
60 


Val 
65 


Leu 


Gin 


Leu 


Asp 


Gly 
70 


Glu 


Val Lys Val 


Pro 
75 


Thr Ala 


Pro His Leu 
80 


Ser 


Cys 


Val 


Gly 


Asp 
85 


Ser 


Lys 


Ala Glu Leu 
90 


Arg 


Glu Leu 


Leu Gly Arg 
95 


Tyr 


Arg 


Glu 


Ala 
100 


Gly 


He 


Arg 


Arg He Val 
105 


Ala 


Leu Arg 


Gly Asp Leu 
110 


Pro 


Ser 


Gly 
115 


Met 


Gly 


Met 


Ala 


Ser Gly Glu 
120 


Leu 


Arg Tyr 
125 


Ala Asn Glu 


Leu 


Val 
130 


Asp 


Phe 


He 


Arg 


Thr 
135 


Glu Thr Gly Asp 


His Phe 
140 


His He Glu 


Val 


Ala 


Ala 


Tyr 


Pro 


Glu 


Val 


His Pro Gin 


Ala 


Arg Ser 


Phe Glu Asp 



145 



150 



155 



160 



Asp Leu Ala Asn Phe Val Arg Lys Val Lys Ala Gly Ala Ser Ser Ala 

M/43126 MetF 



lie Thr Gin Tyr 
180 

Arg Val Ala Lys 
195 



165 

Phe Phe Asn Ala 

Leu Gly Val Asp 
200 



170 

Asp Ala Tyr Phe 
185 

lie Pro Val Val 



175 

Tyr Phe Val Glu 
190 

Pro Gly lie Met 
205 



Pro lie Thr Asn Tyr Ser Lys Leu 
210 215 

Ala Glu Leu Pro Arg Trp lie Arg 
225 230 

Asp Ser Arg Ser lie Gin Ala Phe 
245 

Cys Glu Arg Leu Leu Glu Gly Gly 
260 

•u Asn Gin Ala Asp Pro Ser Leu 
275 280 

Pro Arg 
290 



Ala Arg Phe Ser Asp Ala Cys Gly 
220 

Lys Gin Leu Glu Ala Tyr Gly Asp 
235 240 

Gly Glu Gin Val He Ser Glu Met 
250 255 

Ala Pro Gly Leu His Phe Tyr Thr 
265 270 

Ala He Trp Lys Asn Leu Gin Leu 
285 



<210> 


15 


<211> 


828 


<212> 


DNA 


<213> 


Xylella almond 


<220> 




<221> 


CDS 


<222> 


(1) . . (825) 


<223> 


RXFX00359 


<400> 


15 


atg att cca ate age 


Met He Pro He Ser 




5 



gag ttt tat cca ccc aaa aac gac gat caa 4 8 
! Glu Phe Tyr Pro Pro Lys Asn Asp Asp Gin 
10 15 

^gc gca cag ttg gac agg aca gca aac egg eta cgc gca ttc gca cca 96 
Arg Ala Gin Leu Asp Arg Thr Ala Asn Arg Leu Arg Ala Phe Ala Pro 
20 25 30 

gaa tac gtc tec tgc acc ttc ggc gec ggt ggc tec aca etc agt tac 144 
Glu Tyr Val Ser Cys Thr Phe Gly Ala Gly Gly Ser Thr Leu Ser Tyr 
35 40 45 

acc tea gaa aca gtg cgc cat etc age caa cac cac ggc ttt gac gee 192 
Thr Ser Glu Thr Val Arg His Leu Ser Gin His His Gly Phe Asp Ala 
50 55 60 

gca ccg cat ctg tec tgt gtg ggc ggc agt cgc caa gaa ate cgc gaa 240 
Ala Pro His Leu Ser Cys Val Gly Gly Ser Arg Gin Glu He Arg Glu 
65 70 75 80 

ctt etc aaa ctg tac cgc gcg att ggc tgc caa cgc ate gtg gcg eta 288 
Leu Leu Lys Leu Tyr Arg Ala He Gly Cys Gin Arg He Val Ala Leu 
85 90 95 



M/43126 
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19 

cgc ggc gat etc ccc teg ggc atg ggc cac ccc ggc gac etc cgc tac 336 
Arg Gly Asp Leu Pro Ser Gly Met Gly His Pro Gly Asp Leu Arg Tyr 
100 105 110 

gca get gac ctg att ace ttc ate cgt acc gag cat ggc gat cac ttc 3 84 
Ala Ala Asp Leu He Thr Phe He Arg Thr Glu His Gly Asp His Phe 
115 120 125 

cac eta gag ate ggc gca tac ccg gaa acc cac cca caa gee age aac 432 
His Leu Glu He Gly Ala Tyr Pro Glu Thr His Pro Gin Ala Ser Asn 
130 135 140 

aca ctg aac gac ctt cac tat ttc aaa gee aaa gee gat gca ggc gee 480 
Thr Leu Asn Asp Leu His Tyr Phe Lys Ala Lys Ala Asp Ala Gly Ala 
145 150 155 160 

gat gcg gca ate act caa tac ttt tat aac cca gac gee tat ttc cac 528 
Asp Ala Ala He Thr Gin Tyr Phe Tyr Asn Pro Asp Ala Tyr Phe His 
165 170 175 

tc gtc gac gca gtg cag cgc ctg ggc gtc acc ate ccc att gtt gee 576 
1 e Val Asp Ala Val Gin Arg Leu Gly Val Thr He Pro He Val Ala 
180 185 190 

gga gtc atg ccc ate tec aac ttt gac cag ttg cgc cat ttc tec gaa 624 
Gly Val Met Pro He Ser Asn Phe Asp Gin Leu Arg His Phe Ser Glu 
195 200 205 

caa tgc ggc gee gaa ata ccc cgc tgg att aca aaa aaa atg cag get 672 
Gin Cys Gly Ala Glu He Pro Arg Trp He Thr Lys Lys Met Gin Ala 
210 215 220 

tac ggc gac gac acc aaa teg ata cgc gcg ttc ggt gee gac gtc gtg 72 0 
Tyr Gly Asp Asp Thr Lys Ser He Arg Ala Phe Gly Ala Asp Val Val 
225 230 235 240 

acc gca tta tgt gag egg eta ate get ggc ggc gca ccg ggg ctg cac 768 
Thr Ala Leu Cys Glu Arg Leu He Ala Gly Gly Ala Pro Gly Leu His 
245 250 255 



m 



tc tac acg etc aac eta gee aaa cca age acc caa gtg ctg caa cgc 816 
e Tyr Thr Leu Asn Leu Ala Lys Pro Ser Thr Gin Val Leu Gin Arg 
260 265 270 



tta ggc tat tga 828 
Leu Gly Tyr 
275 



<210> 16 
<211> 275 
<212> PRT 

<213> Xylella almond 
<400> 16 

Met He Pro He Ser Phe Glu Phe Tyr Pro Pro Lys Asn Asp Asp Gin 
15 10 15 

Arg Ala Gin Leu Asp Arg Thr Ala Asn Arg Leu Arg Ala Phe Ala Pro 
20 25 30 

Glu Tyr Val Ser Cys Thr Phe Gly Ala Gly Gly Ser Thr Leu Ser Tyr 
35 40 45 



M/43126 
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Thr Ser Glu Thr Val Arg His Leu Ser Gin His His Gly Phe Asp Ala 

50 55 60 

Ala Pro His Leu Ser Cys Val Gly Gly Ser Arg Gin Glu lie Arg Glu 
65 70 75 80 

Leu Leu Lys Leu Tyr Arg Ala lie Gly Cys Gin Arg lie Val Ala Leu 
85 90 95 

Arg Gly Asp Leu Pro Ser Gly Met Gly His Pro Gly Asp Leu Arg Tyr 
100 105 110 

Ala Ala Asp Leu lie Thr Phe lie Arg Thr Glu His Gly Asp His Phe 
115 120 125 

His Leu Glu lie Gly Ala Tyr Pro Glu Thr His Pro Gin Ala Ser Asn 
130 135 140 



•hr Leu Asn Asp Leu His Tyr Phe Lys Ala Lys Ala Asp Ala Gly Ala 
' 5 150 155 160 



Asp Ala Ala lie Thr Gin Tyr Phe Tyr Asn Pro Asp Ala Tyr Phe His 
165 170 175 

Phe Val Asp Ala Val Gin Arg Leu Gly Val Thr lie Pro lie Val Ala 
180 185 190 

Gly Val Met Pro He Ser Asn Phe Asp Gin Leu Arg His Phe Ser Glu 
195 200 205 

Gin Cys Gly Ala Glu He Pro Arg Trp He Thr Lys Lys Met Gin Ala 
210 215 220 

Tyr Gly Asp Asp Thr Lys Ser He Arg Ala Phe Gly Ala Asp Val Val 
225 230 235 240 



Thr Ala Leu Cys Glu Arg Leu He Ala Gly Gly Ala Pro Gly Leu His 
245 250 255 



♦ 



e Tyr Thr Leu Asn Leu Ala Lys Pro Ser Thr Gin Val Leu Gin Arg 
260 265 270 



Leu Gly Tyr 
275 



<210> 17 
<211> 828 
<212> DNA 

<213> Xylella oleander 

<220> 
<221> CDS 
<222> (1) . . (825) 
<223> RXFY01676 



<400> 17 

atg att cca ate age ttc gag ttt tat cca ccc aaa aac gac gat caa 

Met He Pro He Ser Phe Glu Phe Tyr Pro Pro Lys Asn Asp Asp Gin 

1 5 10 15 



M/43126 




cgc gca cag ttg gac agg aca gca aac egg eta cgc gca ttc gca cca 

Arg Ala Gin Leu Asp Arg Thr Ala Asn Arg Leu Arg Ala Phe Ala Pro 
20 25 30 

gaa tac gtc tec tgc ace ttc ggc gee ggc ggc tec aca etc agt tac 

Glu Tyr Val Ser Cys Thr Phe Gly Ala Gly Gly Ser Thr Leu Ser Tyr 
35 40 45 

ace tea gaa aca gtg cgc cat etc agt caa cac cac ggc ttt gac ace 

Thr Ser Glu Thr Val Arg His Leu Ser Gin His His Gly Phe Asp Thr 
50 55 60 

gca ccg cat ctg tec tgt gtg ggc ggc agt cgc caa gaa ate cgc gaa 

Ala Pro His Leu Ser Cys Val Gly Gly Ser Arg Gin Glu lie Arg Glu 

65 70 75 80 

ctt etc aaa ctg tac cgc gcg att ggc tgc caa cgc ate gtg gcg eta 

Leu Leu Lys Leu Tyr Arg Ala lie Gly Cys Gin Arg lie Val Ala Leu 
85 90 95 



cgc ggc gat etc ccc teg ggc atg ggc cac ccc ggc gac etc cgc tac 
Arg Gly Asp Leu Pro Ser Gly Met Gly His Pro Gly Asp Leu Arg Tyr 
100 105 110 



gca get gac ctg att ace ttc ate cgt gee gag cat ggc gat cac ttc 

Ala Ala Asp Leu lie Thr Phe lie Arg Ala Glu His Gly Asp His Phe 

115 120 125 

cac eta gag ate ggc gca tac ccg gaa ace cac cca caa gee age aac 

His Leu Glu lie Gly Ala Tyr Pro Glu Thr His Pro Gin Ala Ser Asn 
130 135 140 

aca ctg aac gac ctt cac tat ttc aaa gee aaa gee gat gca ggc gee 

Thr Leu Asn Asp Leu His Tyr Phe Lys Ala Lys Ala Asp Ala Gly Ala 

145 150 155 160 



• 



gat gcg gca ate act caa tac ttt tac aac cca gac gec tat ttc cac 
sp Ala Ala lie Thr Gin Tyr Phe Tyr Asn Pro Asp Ala Tyr Phe His 
165 170 175 



ttc gtc gac gca gtg cag cgc ctg ggc gtc ace ate ccc att gtt gee 
Phe Val Asp Ala Val Gin Arg Leu Gly Val Thr lie Pro He Val Ala 
180 185 190 

gga gtc atg ccc ate tec aac ttt gac cag ttg cgc cat ttc tec gaa 
Gly Val Met Pro He Ser Asn Phe Asp Gin Leu Arg His Phe Ser Glu 
195 200 205 

caa tgc ggc gee gaa ata ccc cgc tgg att aca aaa aaa atg cag get 
Gin Cys Gly Ala Glu He Pro Arg Trp He Thr Lys Lys Met Gin Ala 
210 215 220 

tac ggc gat gac acc aaa teg ata cgc gcg ttc ggt gee gac gtc gtg 
Tyr Gly Asp Asp Thr Lys Ser He Arg Ala Phe Gly Ala Asp Val Val 
225 230 235 240 

acc gca eta tgt gag egg eta ate get ggc ggc gca ccg ggg ctg cac 
Thr Ala Leu Cys Glu Arg Leu He Ala Gly Gly Ala Pro Gly Leu His 
245 250 255 
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22 



ttc tac acg etc aac eta gec aaa cca age acc caa gtg ctg caa cgc 816 
Phe Tyr Thr Leu Asn Leu Ala Lys Pro Ser Thr Gin Val Leu Gin Arg 
260 265 270 

tta ggc tat tga 828 
Leu Gly Tyr 
275 



<210> 18 
<211> 275 
<212> PRT 

<213> Xylella oleander 
<400> 18 

Met lie Pro lie Ser Phe Glu Phe Tyr Pro Pro Lys Asn Asp Asp Gin 
15 10 15 



Arg Ala Gin Leu Asp Arg Thr Ala Asn Arg Leu Arg Ala Phe Ala Pro 
20 25 30 




u Tyr Val Ser Cys Thr Phe Gly Ala Gly Gly Ser Thr Leu Ser Tyr 
35 40 45 

Thr Ser Glu Thr Val Arg His Leu Ser Gin His His Gly Phe Asp Thr 
50 55 60 

Ala Pro His Leu Ser Cys Val Gly Gly Ser Arg Gin Glu lie Arg Glu 
65 70 75 80 

Leu Leu Lys Leu Tyr Arg Ala lie Gly Cys Gin Arg lie Val Ala Leu 
85 90 95 

Arg Gly Asp Leu Pro Ser Gly Met Gly His Pro Gly Asp Leu Arg Tyr 
100 105 110 

Ala Ala Asp Leu lie Thr Phe lie Arg Ala Glu His Gly Asp His Phe 
115 120 125 

is Leu Glu lie Gly Ala Tyr Pro Glu Thr His Pro Gin Ala Ser Asn 
130 135 140 

Thr Leu Asn Asp Leu His Tyr Phe Lys Ala Lys Ala Asp Ala Gly Ala 
145 150 155 160 

Asp Ala Ala lie Thr Gin Tyr Phe Tyr Asn Pro Asp Ala Tyr Phe His 
165 170 175 

Phe Val Asp Ala Val Gin Arg Leu Gly Val Thr He Pro He Val Ala 
180 185 190 

Gly Val Met Pro He Ser Asn Phe Asp Gin Leu Arg His Phe Ser Glu 
195 200 205 

Gin Cys Gly Ala Glu lie Pro Arg Trp He Thr Lys Lys Met Gin Ala 
210 215 220 

Tyr Gly Asp Asp Thr Lys Ser He Arg Ala Phe Gly Ala Asp Val Val 
225 230 235 240 

Thr Ala Leu Cys Glu Arg Leu He Ala Gly Gly Ala Pro Gly Leu His 
245 250 255 
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Phe Tyr Thr Leu Asn Leu Ala Lys Pro Ser Thr Gin Val Leu Gin Arg 
260 265 270 

Leu Gly Tyr 
275 




<210> 19 
<211> 846 

<212> DNA 

<213> Pseodomonas fluorescens 

<220> 
<221> CDS 
<222> (1)..(843) 
<223> RPU04845 

<400> 19 

£g tec caa gac cgt cgc tac age ttc gag ttc ttc ccg acc aag acc 4 8 
t Ser Gin Asp Arg Arg Tyr Ser Phe Glu Phe Phe Pro Thr Lys Thr 
1 5 10 15 

gat get ggg cat gaa aaa ctg etc gee act gee cgt cag ctg gec acc 96 
Asp Ala Gly His Glu Lys Leu Leu Ala Thr Ala Arg Gin Leu Ala Thr 
20 25 30 

tat aag cct gac ttc ttt tec tgc acc tac ggc get ggc ggt teg acc 144 
Tyr Lys Pro Asp Phe Phe Ser Cys Thr Tyr Gly Ala Gly Gly Ser Thr 
35 40 45 

cgt gac cgc acg ctg aac acc gtt ctg cag ctg gaa age gaa gtc aaa 192 
Arg Asp Arg Thr Leu Asn Thr Val Leu Gin Leu Glu Ser Glu Val Lys 
50 55 60 

ate ccc gee gca ccg cac ctg teg tgc gtc ggc gac age aag gac gac 240 
He Pro Ala Ala Pro His Leu Ser Cys Val Gly Asp Ser Lys Asp Asp 
65 70 75 80 



tg cgc ggc ctg ctg aac gag tac aag gee gee ggc ate aag cgc ate 2 88 
u Arg Gly Leu Leu Asn Glu Tyr Lys Ala Ala Gly He Lys Arg He 
85 90 95 



gtc gee ctg cgc ggt gac ctg ccg tec ggc atg ggc atg acc age ggc 3 36 

Val Ala Leu Arg Gly Asp Leu Pro Ser Gly Met Gly Met Thr Ser Gly 
100 105 110 

gag ctg cgt cac gee aat gaa ctg gtt gaa ttc att cgt gaa gaa acc 3 84 

Glu Leu Arg His Ala Asn Glu Leu Val Glu Phe He Arg Glu Glu Thr 
115 120 125 

ggc aat cat ttc cac ate gaa gtc gee gee tac ccg gag atg cat ccg 4 32 

Gly Asn His Phe His He Glu Val Ala Ala Tyr Pro Glu Met His Pro 
130 135 140 

caa gcg cgc aac tac gaa gac gat etc gee aac ttc gtg cgc aag gee 4 80 

Gin Ala Arg Asn Tyr Glu Asp Asp Leu Ala Asn Phe Val Arg Lys Ala 

145 150 " 155 160 

cgt gee ggc gee gac age gcg ate acc cag tac ttc ttc aac gee gac 528 
Arg Ala Gly Ala Asp Ser Ala He Thr Gin Tyr Phe Phe Asn Ala Asp 
165 170 175 
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age tac ttc tac ttc gtc gac cgt ttg cag gcg ctg ggc gtg gac att 576 
Ser Tyr Phe Tyr Phe Val Asp Arg Leu Gin Ala Leu Gly Val Asp lie 
180 185 190 

ccg gtg gta ccg ggg ate atg ccg ate acc aac tac age aaa etc gcg 624 
Pro Val Val Pro Gly lie Met Pro lie Thr Asn Tyr Ser Lys Leu Ala 
195 200 205 

cgc ttc tec gat gee tgc ggt gcg gaa ate ccg cgc tgg ate cgc aag 672 
Arg Phe Ser Asp Ala Cys Gly Ala Glu He Pro Arg Trp He Arg Lys 
210 215 220 

cag ctg gaa gee tac ggc gat gac age caa age att cag cgc ttt ggc 720 
Gin Leu Glu Ala Tyr Gly Asp Asp Ser Gin Ser He Gin Arg Phe Gly 
225 230 235 240 

gaa caa gtc gtc acg gaa atg tgc gaa cgc ctg ctg caa ggc ggc gcg 768 
Glu Gin Val Val Thr Glu Met Cys Glu Arg Leu Leu Gin Gly Gly Ala 
245 250 255 

c ggc ctg cac ttc tat tec atg aac cag gee gaa cca age ctg gcg 816 
o Gly Leu His Phe Tyr Ser Met Asn Gin Ala Glu Pro Ser Leu Ala 
260 265 270 

ate tgg aac aac ctg aag ctg ccg cgc taa 846 
He Trp Asn Asn Leu Lys Leu Pro Arg 
275 280 



<210> 20 
<211> 281 
<212> PRT 

<213> Pseodomonas fluorescens 
<400> 20 

Met Ser Gin Asp Arg Arg Tyr Ser Phe Glu Phe Phe Pro Thr Lys Thr 
15 10 15 

Asp Ala Gly His Glu Lys Leu Leu Ala Thr Ala Arg Gin Leu Ala Thr 
20 25 " 30 



Lys Pro Asp Phe Phe Ser Cys Thr Tyr Gly Ala Gly Gly Ser Thr 
35 40 45 



Arg Asp Arg Thr Leu Asn Thr Val Leu Gin Leu Glu Ser Glu Val Lys 
50 55 60 

He Pro Ala Ala Pro His Leu Ser Cys Val Gly Asp Ser Lys Asp Asp 
65 70 75 80 

Leu Arg Gly Leu Leu Asn Glu Tyr Lys Ala Ala Gly He Lys Arg He 
85 90 ^ 95 

Val Ala Leu Arg Gly Asp Leu Pro Ser Gly Met Gly Met Thr Ser Gly 
100 105 110 

Glu Leu Arg His Ala Asn Glu Leu Val Glu Phe He Arg Glu Glu Thr 
115 120 125 

Gly Asn His Phe His He Glu Val Ala Ala Tyr Pro Glu Met His Pro 
130 135 140 
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Gin Ala Arg Asn Tyr Glu Asp Asp Leu Ala Asn Phe Val Arg Lys Ala 
145 150 155 160 

Arg Ala Gly Ala Asp Ser Ala He Thr Gin Tyr Phe Phe Asn Ala Asp 
165 170 175 

Ser Tyr Phe Tyr Phe Val Asp Arg Leu Gin Ala Leu Gly Val Asp He 
180 185 190 

Pro Val Val Pro Gly He Met Pro He Thr Asn Tyr Ser Lys Leu Ala 
195 200 205 

Arg Phe Ser Asp Ala Cys Gly Ala Glu He Pro Arg Trp He Arg Lys 
210 215 220 

Gin Leu Glu Ala Tyr Gly Asp Asp Ser Gin Ser He Gin Arg Phe Gly 
225 230 235 ~ 240 

Glu Gin Val Val Thr Glu Met Cys Glu Arg Leu Leu Gin Gly Gly Ala 
245 250 255 

o Gly Leu His Phe Tyr Ser Met Asn Gin Ala Glu Pro Ser Leu Ala 
260 265 270 

He Trp Asn Asn Leu Lys Leu Pro Arg 
275 280 



<210> 21 
<211> 1812 
<212> DNA 

<213> Schizosaccharomyces pombe 

<220> 

<221> CDS 

<222> (1) . . (1809) 

<223> RS001645 



<400> 21 

atg aaa ata agt gac aaa tta ctt cac ccg gat tgg aag gaa aaa gtt 48 
"et Lys He Ser Asp Lys Leu Leu His Pro Asp Trp Lys Glu Lys Val 
1 5 io 15 



act tac agt tat gaa ttt ttt cct cca aaa acg age act ggt gtc caa 96 
Thr Tyr Ser Tyr Glu Phe Phe Pro Pro Lys Thr Ser Thr Gly Val Gin 
20 25 30 

aat ctt tac aat cgt ata gat cgc atg aag act tgg ggt cgt ccc atg 144 
Asn Leu Tyr Asn Arg He Asp Arg Met Lys Thr Trp Gly Arg Pro Met 
35 40 45 

ttt gtc gat gtg act tgg ggt get ggt ggt act tct tea gaa ctg act 192 
Phe Val Asp Val Thr Trp Gly Ala Gly Gly Thr Ser Ser Glu Leu Thr 
50 55 60 

cct gga ate gtt aat gta att caa aca gat ttt gaa gtg gat act tgc 240 
Pro Gly He Val Asn Val He Gin Thr Asp Phe Glu Val Asp Thr Cys 
65 70 75 80 



atg cat ttg act tgt acg aac atg tec aca gaa atg att gac gca get 
Met His Leu Thr Cys Thr Asn Met Ser Thr Glu Met He Asp Ala Ala 



288 

Ala 

85 90 95 
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ttg aaa egg get cat gaa aca ggg tgt cgt aac at a ttg gec ctt aga 
Leu Lys Arg Ala His Glu Thr Gly Cys Arg Asn lie Leu Ala Leu Arg 
100 105 ~ 110 

ggt gat cct gtt aaa gat aca gac tgg act gaa ggc gaa agt gga ttc 
Gly Asp Pro Val Lys Asp Thr Asp Trp Thr Glu Gly Glu Ser Gly Phe 
115 120 125 

egg tat get tea gac tta gtt aga tat att cgc aca cat tat aat gat 
Arg Tyr Ala Ser Asp Leu Val Arg Tyr lie Arg Thr His Tyr Asn Asp 
13 0 135 140 

gaa ttc tgt att ggt gta get ggc tat cca gaa gga tat tea cca gat 
Glu Phe Cys lie Gly Val Ala Gly Tyr Pro Glu Gly Tyr Ser Pro Asp 
145 150 155 160 

gat gac att gat gaa age ata aag cat ctg aaa tta aaa gtc gat gaa 
Asp Asp lie Asp Glu Ser lie Lys His Leu Lys Leu Lys Val Asp Glu 
165 170 175 



t get gat ttt ate gtt act caa atg ttt tat gat gta gac aat ttt 
y Ala Asp Phe lie Val Thr Gin Met Phe Tyr Asp Val Asp Asn Phe 
180 185 190 



ate gca tgg gtc gat aaa gtg cgt gca gca gga ata aat ate cct ata 
lie Ala Trp Val Asp Lys Val Arg Ala Ala Gly lie Asn lie Pro lie 
195 200 205 

ttt ccg ggc att atg cct att cag gca tgg gat tec ttt att egg aga 
Phe Pro Gly lie Met Pro lie Gin Ala Trp Asp Ser Phe lie Arg Arg 
210 215 220 

gcg aaa tgg age ggt gtt aaa att ccc cag cat ttt atg gat act eta 
Ala Lys Trp Ser Gly Val Lys lie Pro Gin His Phe Met Asp Thr Leu 
225 230 235 240 

gtc cca gtt aaa gac gat gat gaa gga gtc cgt gag cgt ggt gtt gag 
Val Pro Val Lys Asp Asp Asp Glu Gly Val Arg Glu Arg Gly Val Glu 
245 250 255 



tc ata gtc gaa atg tgc cgt aag ctt ata get agt ggc att acg aga 
Su lie Val Glu Met Cys Arg Lys Leu lie Ala Ser Gly lie Thr Arg 
260 265 270 



ctt cat ttt tac act atg aat tta gaa aag gec gtt aaa atg att att 

Leu His Phe Tyr Thr Met Asn Leu Glu Lys Ala Val Lys Met He He 

275 280 285 

gaa cga tta ggt tta tta gat gaa aac ttg get cct ata gtg gat act 

Glu Arg Leu Gly Leu Leu Asp Glu Asn Leu Ala Pro He Val Asp Thr 

290 295 300 

aat aac gtc gag tta ace aat get tec agt caa gat cgt egg ata aat 

Asn Asn Val Glu Leu Thr Asn Ala Ser Ser Gin Asp Arg Arg He Asn 

305 310 315 ~ 320 

gaa ggt gta egg ccc att ttc tgg cgc act cgt aat gaa agt tat gtc 

Glu Gly Val Arg Pro He Phe Trp Arg Thr Arg Asn Glu Ser Tyr Val 

325 330 335 

teg cgt act gat cag tgg gac gaa tta ccg cat ggt cgt tgg ggt gac 

Ser Arg Thr Asp Gin Trp Asp Glu Leu Pro His Gly Arg Trp Gly Asp 

340 345 350 
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tct cgt age cct get ttt ggc gaa ttt gat get att aga tat ggt ctt 1104 
Ser Arg Ser Pro Ala Phe Gly Glu Phe Asp Ala lie Arg Tyr Gly Leu 
355 360 365 

cgt atg tct ccc aag gag ate aca aca teg tgg ggg tct cct aaa tct 1152 
Arg Met Ser Pro Lys Glu lie Thr Thr Ser Trp Gly Ser Pro Lys Ser 
370 375 380 

tac teg gaa ate ggc gat ttg ttt gec agg tac tgt gaa aaa aag att 12 00 
Tyr Ser Glu lie Gly Asp Leu Phe Ala Arg Tyr Cys Glu Lys Lys lie 
385 390 395 400 

age tec etc cct tgg agt gat ctt ccc ata tec gat gaa gee gac ttg 1248 
Ser Ser Leu Pro Trp Ser Asp Leu Pro lie Ser Asp Glu Ala Asp Leu 
405 410 415 

att egg gat caa ctt eta agt atg aat aga aac get ttc ctt act ata 1296 
lie Arg Asp Gin Leu Leu Ser Met Asn Arg Asn Ala Phe Leu Thr lie 
420 425 430 

t tct caa cct get ctt aac ggc gaa aag agt tea cat cct gtt ttt 1344 
n Ser Gin Pro Ala Leu Asn Gly Glu Lys Ser Ser His Pro Val Phe 
435 440 445 

gga tgg gga cca cct aat £gt tat gtt ttc caa aaa cca tac gtt gag 1392 
Gly Trp Gly Pro Pro Asn Gly Tyr Val Phe Gin Lys Pro Tyr Val Glu 
450 455 460 

ttt ttc gtt cae ccc tea etc ttg aat gaa etc aaa gaa ace gtt aaa 1440 
Phe Phe Val His Pro Ser Leu Leu Asn Glu Leu Lys Glu Thr Val Lys 
465 470 475 480 

aag ctt aat tea gtt tec tac ttt gtt aca aac aag aat gga gac ttg 1488 
Lys Leu Asn Ser Val Ser Tyr Phe Val Thr Asn Lys Asn Gly Asp Leu 
485 490 " 495 

gat acc aac tea caa tat gag att cca aat gcg gtt aca tgg ggt gtt 1536 
Asp Thr Asn Ser Gin Tyr Glu lie Pro Asn Ala Val Thr Trp Gly Val 
500 505 510 



c cct aat cgt gag att ate caa cct act att gtc gag tea acc tct 1584 
e Pro Asn Arg Glu lie lie Gin Pro Thr lie Val Glu Ser Thr Ser 
515 520 525 



ttt ctt get tgg aaa gat gaa gee tat tea ttg ggc atg gaa tgg get 1632 
Phe Leu Ala Trp Lys Asp Glu Ala Tyr Ser Leu Gly Met Glu Trp Ala 

530 535 540 

aat gca tat age cct gat tea att tct cgt aaa ctt ttg gtt tct atg 1680 

Asn Ala Tyr Ser Pro Asp Ser lie Ser Arg Lys Leu Leu Val Ser Met 
545 550 555 560 

atg aag gaa tgg ttc ctt tgt gtc ata gtt gat aac gat ttt caa aat 1728 

Met Lys Glu Trp Phe Leu Cys Val He Val Asp Asn Asp Phe Gin Asn 
565 570 575 

ggg caa tct ttg ttt gat gtt ttt aac aaa atg aga tct tta aaa gac 17 76 

Gly Gin Ser Leu Phe Asp Val Phe Asn Lys Met Arg Ser Leu Lys Asp 
580 585 590 

ate cat cct gag eta tat tat gca aat gca tea taa 1812 
He His Pro Glu Leu Tyr Tyr Ala Asn Ala Ser 
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595 600 



<210> 22 
<211> 603 
<212> PRT 

<213> Schizosaccharomyces pombe 
<400> 22 

Met Lys He Ser Asp Lys Leu Leu His Pro Asp Trp Lys Glu Lys Val 
1 5 10 15 

Thr Tyr Ser Tyr Glu Phe Phe Pro Pro Lys Thr Ser Thr Gly Val Gin 
20 25 30 

Asn Leu Tyr Asn Arg He Asp Arg Met Lys Thr Trp Gly Arg Pro Met 
35 40 45 

Phe Val Asp Val Thr Trp Gly Ala Gly Gly Thr Ser Ser Glu Leu Thr 
50 55 60 



o Gly He Val Asn Val He Gin Thr Asp Phe Glu Val Asp Thr Cys 
5 70 75 80 




Met His Leu Thr Cys Thr Asn Met Ser Thr Glu Met He Asp Ala Ala 
85 90 95 

Leu Lys Arg Ala His Glu Thr Gly Cys Arg Asn He Leu Ala Leu Arg 
100 105 110 

Gly Asp Pro Val Lys Asp Thr Asp Trp Thr Glu Gly Glu Ser Gly Phe 
115 120 125 

Arg Tyr Ala Ser Asp Leu Val Arg Tyr He Arg Thr His Tyr Asn Asp 
130 135 140 

Glu Phe Cys He Gly Val Ala Gly Tyr Pro Glu Gly Tyr Ser Pro Asp 
145 150 155 160 

Asp Asp He Asp Glu Ser He Lys His Leu Lys Leu Lys Val Asp Glu 
165 170 175 

'ly Ala Asp Phe He Val Thr Gin Met Phe Tyr Asp Val Asp Asn Phe 
180 185 190 

He Ala Trp Val Asp Lys Val Arg Ala Ala Gly He Asn He Pro He 
195 200 205 

Phe Pro Gly He Met Pro He Gin Ala Trp Asp Ser Phe He Arg Arg 
210 215 220 

Ala Lys Trp Ser Gly Val Lys He Pro Gin His Phe Met Asp Thr Leu 
225 230 " 235 240 

Val Pro Val Lys Asp Asp Asp Glu Gly Val Arg Glu Arg Gly Val Glu 
245 250 255 

Leu He Val Glu Met Cys Arg Lys Leu He Ala Ser Gly He Thr Arg 
260 265 270 

Leu His Phe Tyr Thr Met Asn Leu Glu Lys Ala Val Lys Met He He 
275 280 285 
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Glu Arg Leu Gly Leu Leu Asp Glu Asn Leu Ala Pro He Val Asp Thr 
290 295 300 

Asn Asn Val Glu Leu Thr Asn Ala Ser Ser Gin Asp Arg Arg He Asn 
305 310 315 ^ 320 

Glu Gly Val Arg Pro He Phe Trp Arg Thr Arg Asn Glu Ser Tyr Val 
325 330 335 

Ser Arg Thr Asp Gin Trp Asp Glu Leu Pro His Gly Arg Trp Gly Asp 
340 345 350 

Ser Arg Ser Pro Ala Phe Gly Glu Phe Asp Ala He Arg Tyr Gly Leu 
355 360 365 

Arg Met Ser Pro Lys Glu He Thr Thr Ser Trp Gly Ser Pro Lys Ser 
370 375 380 

Tyr Ser Glu He Gly Asp Leu Phe Ala Arg Tyr Cys Glu Lys Lys He 
385 390 395 400 

r Ser Leu Pro Trp Ser Asp Leu Pro He Ser Asp Glu Ala Asp Leu 
405 410 " 415 

He Arg Asp Gin Leu Leu Ser Met Asn Arg Asn Ala Phe Leu Thr He 
420 425 430 

Asn Ser Gin Pro Ala Leu Asn Gly Glu Lys Ser Ser His Pro Val Phe 
435 440 445 

Gly Trp Gly Pro Pro Asn Gly Tyr Val Phe Gin Lys Pro Tyr Val Glu 
450 455 460 

Phe Phe Val His Pro Ser Leu Leu Asn Glu Leu Lys Glu Thr Val Lys 
465 470 475 480 

Lys Leu Asn Ser Val Ser Tyr Phe Val Thr Asn Lys Asn Gly Asp Leu 
485 490 495 



Asp Thr Asn Ser Gin Tyr Glu He Pro Asn Ala Val Thr Trp Gly Val 
500 505 510 



e Pro Asn Arg Glu He He Gin Pro Thr He Val Glu Ser Thr Ser 
515 520 525 

Phe Leu Ala Trp Lys Asp Glu Ala Tyr Ser Leu Gly Met Glu Trp Ala 
530 535 540 

Asn Ala Tyr Ser Pro Asp Ser He Ser Arg Lys Leu Leu Val Ser Met 
54 5 550 555 560 

Met Lys Glu Trp Phe Leu Cys Val He Val Asp Asn Asp Phe Gin Asn 
565 570 575 

Gly Gin Ser Leu Phe Asp Val Phe Asn Lys Met Arg Ser Leu Lys Asp 
580 585 590 

He His Pro Glu Leu Tyr Tyr Ala Asn Ala Ser 
595 600 



<210> 23 
<211> 1800 
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<212> DNA 

<213> Saccharomyces cerevisiae 

<220> 

<221> CDS 

<222> (1) . . (1797) 

<223> RSC08323 



<400> 23 

atg aag ate aca gaa aaa tta gag caa cat aga cag acc tct ggc aag 4 8 
Met Lys lie Thr Glu Lys Leu Glu Gin His Arg Gin Thr Ser Gly Lys 
1 5 10 15 

ccc act tac tea ttc gag tac ttc gtc ccg aag act aca caa ggt gta 96 
Pro Thr Tyr Ser Phe Glu Tyr Phe Val Pro Lys Thr Thr Gin Gly Val 
20 25 30 

cag aac ctg tat gac egg atg gac egg atg tac gag get tct ttg ccc 144 
Gin Asn Leu Tyr Asp Arg Met Asp Arg Met Tyr Glu Ala Ser Leu Pro 
35 40 ~ 45 




a ttt att gac ate acc tgg aat gca ggc ggt gga egg ttg tea cat 192 
In Phe lie Asp lie Thr Trp Asn Ala Gly Gly Gly Arg Leu Ser His 
50 55 60 

ctg tec acg gac ttg gtt gcg aca gcg cag tct gtg ctt ggt ttg gaa 240 
Leu Ser Thr Asp Leu Val Ala Thr Ala Gin Ser Val Leu Gly Leu Glu 
65 70 75 80 

acg tgc atg cac ctt acc tgc acc aat atg ccc att teg atg att gac 288 
Thr Cys Met His Leu Thr Cys Thr Asn Met Pro lie Ser Met He Asp 
85 90 95 

gac get tta gaa aac get tat cac tec ggt tgc cag aac ate eta gcg 336 
Asp Ala Leu Glu Asn Ala Tyr His Ser Gly Cys Gin Asn lie Leu Ala 
100 105 110 

ctg aga gga gat cct cct agg gac gca gaa aac tgg act ccc gtt gaa 3 84 
Leu Arg Gly Asp Pro Pro Arg Asp Ala Glu Asn Trp Thr Pro Val Glu 
115 120 125 

fgt ggc ttc cag tat gec aag gac ttg att aag tat ate aag tec aag 432 
f3ly Gly Phe Gin Tyr Ala Lys Asp Leu He Lys Tyr He Lys Ser Lys 
130 135 140 

tac ggt gac cat ttc get ate ggc gtt gee ggc tac ccg gag tgc cat 480 
Tyr Gly Asp His Phe Ala He Gly Val Ala Gly Tyr Pro Glu Cys His 
145 150 155 160 

ccg gag ttg cct aac aaa gac gtg aag ctt gat etc gag tat ttg age 52 8 
Pro Glu Leu Pro Asn Lys Asp Val Lys Leu Asp Leu Glu Tyr Leu Ser 
165 170 175 

aga aga teg acc ggc ggc gac ttc ate ate act cag atg ttt tac gat 57 6 
Arg Arg Ser Thr Gly Gly Asp Phe He He Thr Gin Met Phe Tyr Asp 
180 185 190 

gtt gat aat tta etc aac tgg tgt tec caa gtt aga get gcg ggc atg 624 
Val Asp Asn Leu Leu Asn Trp Cys Ser Gin Val Arg Ala Ala Gly Met 
195 200 205 

gac gtg ccc att att ccc ggg ate atg ccg ate act acc tac gcg gee 672 
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Asp Val Pro lie lie Pro Gly lie Met Pro He Thr Thr Tyr Ala Ala 
210 215 220 

ttc ttg aga agg ate caa tgg ggc caa ate tec ate cct caa cat ttc 
Phe Leu Arg Arg He Gin Trp Gly Gin He Ser He Pro Gin His Phe 
225 230 235 240 

teg tec cga ttg gat cct ate aag gac gat gac gag ttg gtc cgt gat 
Ser Ser Arg Leu Asp Pro He Lys Asp Asp Asp Glu Leu Val Arg Asp 
245 250 255 

ate gga act aac ttg ate gtg gaa atg tgt caa aaa ttg etc gac agt 
He Gly Thr Asn Leu He Val Glu Met Cys Gin Lys Leu Leu Asp Ser 
260 265 270 

ggt tac gtt tct cac ttg cac ate tac acc atg aac ttg gaa aaa gcg 
Gly Tyr Val Ser His Leu His He Tyr Thr Met Asn Leu Glu Lys Ala 
275 280 285 



cct etc atg att ctg gaa aga ttg aac att eta cct acg gaa tea gag 
o Leu Met He Leu Glu Arg Leu Asn He Leu Pro Thr Glu Ser Glu 
290 J295 300 



tc aat gca cat cca ttg gee gtg ttg cca tgg aga aaa tct ttg aat 

Phe Asn Ala His Pro Leu Ala Val Leu Pro Trp Arg Lys Ser Leu Asn 

305 310 315 ^ 320 

cca aag cgt aaa aac gag gaa gtc aga cct ate ttc tgg aag aga aga 

Pro Lys Arg Lys Asn Glu Glu Val Arg Pro He Phe Trp Lys Arg Arg 

325 330 " 335 

cct tac tec tat gtc gca aga acc tct caa tgg gee gtg gac gaa ttc 

Pro Tyr Ser Tyr Val Ala Arg Thr Ser Gin Trp Ala Val Asp Glu Phe 

340 345 350 

ccc aac ggt aga ttc ggt gat teg tct tct cct gcg ttc ggt gac ttg 

Pro Asn Gly Arg Phe Gly Asp Ser Ser Ser Pro Ala Phe Gly Asp Leu 

355 360 365 



0 



gat ctg tgt ggt tea gac ttg ate agg caa tea gcg aac aaa tgt etc 
~sp Leu Cys Gly Ser Asp Leu He Arg Gin Ser Ala Asn Lys Cys Leu 
370 375 380 



aa tta tgg tec acc cct act tec ate aac gac gtc gee ttc ttg gtc 

Glu Leu Trp Ser Thr Pro Thr Ser He Asn Asp Val Ala Phe Leu Val 

385 390 . 395 400 

ate aac tac ttg aat gga aac ttg aag tgt tta cct tgg agt gat ate 

He Asn Tyr Leu Asn Gly Asn Leu Lys Cys Leu Pro Trp Ser Asp He 

405 410 415 

ccc ate aat gat gaa ata aat cca ate aaa gca cac ttg att gag ctg 

Pro He Asn Asp Glu He Asn Pro He Lys Ala His Leu He Glu Leu 

420 425 430 

aac cag cat tct ate ate act ata aac tct caa cct caa gtc aac ggc 

Asn Gin His Ser He He Thr He Asn Ser Gin Pro Gin Val Asn Gly 

435 440 445 

att agg tec aat gac aaa att cat ggt tgg gga ccc aag gat ggt tac 

He Arg Ser Asn Asp Lys He His Gly Trp Gly Pro Lys Asp Gly Tyr 

450 455 460 
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1008 
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1200 



1248 



1296 



1344 



1392 



MetF 




32 

gtt tac cag aag caa tat ttg gaa ttt atg ttg ccc aag act aag ttg 1440 

Val Tyr Gin Lys Gin Tyr Leu Glu Phe Met Leu Pro Lys Thr Lys Leu 
465 470 475 480 

ccc aag ttg att gac acc ttg aaa aac aat gag ttc ttg acc tac ttc 1488 
Pro Lys Leu lie Asp Thr Leu Lys Asn Asn Glu Phe Leu Thr Tyr Phe 
485 490 495 

gcc ate gac tct caa ggt gac ctg eta agt aat cat cca gac aac tec 1536 
Ala lie Asp Ser Gin Gly Asp Leu Leu Ser Asn His Pro Asp Asn Ser 
500 505 510 

aag tec aac get gtg act tgg ggt att ttc ccc ggc aga gaa att ctt 1584 
Lys Ser Asn Ala Val Thr Trp Gly He Phe Pro Gly Arg Glu He Leu 
515 520 525 

caa cct acc att gtc gag aaa att teg ttc tta gcg tgg aag gag gag 163 2 
Gin Pro Thr He Val Glu Lys He Ser Phe Leu Ala Trp Lys Glu Glu 
530 535 540 

£c tat cat ate ttg aat gaa tgg aaa eta aac atg aat aaa tac gat 1680 
je Tyr His He Leu Asn Glu Trp Lys Leu Asn Met Asn Lys Tyr Asp 
5 550 555 560 

aaa ccg cat agt gcc caa ttc att cag tec ttg att gac gat tac tgc 172 8 
Lys Pro His Ser Ala Gin Phe He Gin Ser Leu He Asp Asp Tyr Cys 
565 570 575 

ttg gtc aat att gtt gac aat gac tac att tct cca gat gat caa ate 1776 
Leu Val Asn He Val Asp Asn Asp Tyr He Ser Pro Asp Asp Gin He 
580 585 ^ 590 

cat tec ate eta eta age eta taa 1800 
His Ser He Leu Leu Ser Leu 
595 



<210> 24 
<211> 599 
<212> PRT 

<213> Saccharomyces cerevisiae 



00> 24 

et Lys He Thr Glu Lys Leu Glu Gin His Arg Gin Thr Ser Gly Lys 
15 10 15 

Pro Thr Tyr Ser Phe Glu Tyr Phe Val Pro Lys Thr Thr Gin Gly Val 
20 25 30 

Gin Asn Leu Tyr Asp Arg Met Asp Arg Met Tyr Glu Ala Ser Leu Pro 
35 40 45 

Gin Phe He Asp He Thr Trp Asn Ala Gly Gly Gly Arg Leu Ser His 
50 55 60 

Leu Ser Thr Asp Leu Val Ala Thr Ala Gin Ser Val Leu Gly Leu Glu 
65 70 75 80 

Thr Cys Met His Leu Thr Cys Thr Asn Met Pro He Ser Met He Asp 
85 90 95 

Asp Ala Leu Glu Asn Ala Tyr His Ser Gly Cys Gin Asn He Leu Ala 
100 105 110 
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Leu Arg Gly Asp Pro Pro Arg Asp Ala Glu Asn Trp Thr Pro Val Glu 

115 120 125 

Gly Gly Phe Gin Tyr Ala Lys Asp Leu lie Lys Tyr lie Lys Ser Lys 
130 135 140 

Tyr Gly Asp His Phe Ala lie Gly Val Ala Gly Tyr Pro Glu Cys His 
145 150 155 160 

Pro Glu Leu Pro Asn Lys Asp Val Lys Leu Asp Leu Glu Tyr Leu Ser 
165 170 175 

Arg Arg Ser Thr Gly Gly Asp Phe lie lie Thr Gin Met Phe Tyr Asp 

180 185 190 

Val Asp Asn Leu Leu Asn Trp Cys Ser Gin Val Arg Ala Ala Gly Met 

195 200 205 



Asp Val Pro He He Pro Gly He Met Pro He Thr Thr Tyr Ala Ala 
210 215 220 



fe Leu Arg Arg He Gin Trp Gly Gin He Ser He Pro Gin His Phe 
25 230 235 240 

Ser Ser Arg Leu Asp Pro He Lys Asp Asp Asp Glu Leu Val Arg Asp 
245 250 255 

He Gly Thr Asn Leu He Val Glu Met Cys Gin Lys Leu Leu Asp Ser 
260 265 270 

Gly Tyr Val Ser His Leu His He Tyr Thr Met Asn Leu Glu Lys Ala 
275 280 285 

Pro Leu Met He Leu Glu Arg Leu Asn He Leu Pro Thr Glu Ser Glu 
290 295 300 

Phe Asn Ala His Pro Leu Ala Val Leu Pro Trp Arg Lys Ser Leu Asn 
305 310 315 320 



m 



ro Lys Arg Lys Asn Glu Glu Val Arg Pro He Phe Trp Lys Arg Arg 
325 330 * 335 



ro Tyr Ser Tyr Val Ala Arg Thr Ser Gin Trp Ala Val Asp Glu Phe 
340 345 350 

Pro Asn Gly Arg Phe Gly Asp Ser Ser Ser Pro Ala Phe Gly Asp Leu 
355 360 365 

Asp Leu Cys Gly Ser Asp Leu He Arg Gin Ser Ala Asn Lys Cys Leu 
370 375 380 

Glu Leu Trp Ser Thr Pro Thr Ser He Asn Asp Val Ala Phe Leu Val 
385 390 395 400 

He Asn Tyr Leu Asn Gly Asn Leu Lys Cys Leu Pro Trp Ser Asp He 
405 410 415 

Pro He Asn Asp Glu He Asn Pro He Lys Ala His Leu He Glu Leu 
420 425 430 

Asn Gin His Ser He He Thr He Asn Ser Gin Pro Gin Val Asn Gly 
435 440 445 
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He Arg Ser Asn Asp Lys He His Gly Trp Gly Pro Lys Asp Gly Tyr 
450 455 460 

Val Tyr Gin Lys Gin Tyr Leu Glu Phe Met Leu Pro Lys Thr Lys Leu 
465 470 475 480 

Pro Lys Leu He Asp Thr Leu Lys Asn Asn Glu Phe Leu Thr Tyr Phe 
485 490 495 

Ala He Asp Ser Gin Gly Asp Leu Leu Ser Asn His Pro Asp Asn Ser 
500 505 510 

Lys Ser Asn Ala Val Thr Trp Gly He Phe Pro Gly Arg Glu He Leu 
515 520 525 

Gin Pro Thr He Val Glu Lys He Ser Phe Leu Ala Trp Lys Glu Glu 
530 535 540 

Phe Tyr His He Leu Asn Glu Trp Lys Leu Asn Met Asn Lys Tyr Asp 
,45 550 555 560 

s Pro His Ser Ala Gin Phe He Gin Ser Leu He Asp Asp Tyr Cys 
565 570 575 

Leu Val Asn He Val Asp Asn Asp Tyr He Ser Pro Asp Asp Gin He 
580 585 590 

His Ser He Leu Leu Ser Leu 
595 



<210> 25 
<211> 897 
<212> DNA 

<213> Erwinia carotovora 

<220> 

<221> CDS 

<222> (1) . . (894) 

w <223> REO00089 

400> 25 

atg age ttt ttt cac gca aac cag egg gaa gcg ctg aat caa agt ctg 4 8 

Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

gcg gaa ttg cag gga cga att aat gtg tea ttt gaa ttt ttc ccg cca 96 
Ala Glu Leu Gin Gly Arg He Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

cgt ace age gat atg gaa gaa ace ctg tgg age tct ate gat cga ctg 144 
Arg Thr Ser Asp Met Glu Glu Thr Leu Trp Ser Ser He Asp Arg Leu 
35 40 45 

age age ctg aag ccc aag ttt gtt tec gtg act tac ggg gcg aat tct 192 
Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

ggc gag cgt gac cgt act cac age att ate aaa acg att aaa gag cgt 240 
Gly Glu Arg Asp Arg Thr His Ser He He Lys Thr He Lys Glu Arg 
65 70 75 80 
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acc ggt ctg gaa gcg gca cct cac ctg acc tgc ate gat get tea cgc 

Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys lie Asp Ala Ser Arg 

85 90 95 

gaa cag ctg cgt gaa ate get cag gat tac tgg gag agt ggt ate cgc 

Glu Gin Leu Arg Glu lie Ala Gin Asp Tyr Trp Glu Ser Gly lie Arg 

100 105 110 

cat att gtc gcg ctg cgc ggc gac ttg cct caa gaa ggc ggc aaa ccg 

His He Val Ala Leu Arg Gly Asp Leu Pro Gin Glu Gly Gly Lys Pro 

115 120 125 

gac atg tac gcg gcg gat ctg gtt tec ctg ctg aaa gag gtc ggt gat 

Asp Met Tyr Ala Ala Asp Leu Val Ser Leu Leu Lys Glu Val Gly Asp 

13 0 135 14 0 

ttc gat att tec gtt gec gee tat cct gaa gta cac cct gaa gcg aaa 

Phe Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 

145 150 155 160 

c gcg cag get gac ctg att aac ctg aaa cac aag att gat gee ggc 

r Ala Gin Ala Asp Leu He Asn Leu Lys His Lys He Asp Ala Gly 

165 170 175 

gcg aat cgc get ate aca cag ttc ttt ttc gac gta gaa age tat ttg 

Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 

180 185 190 

egg ttc cgt gac cgc tgc gtg gca acg ggc ate gat gta gaa att gtg 

Arg Phe Arg Asp Arg Cys Val Ala Thr Gly He Asp Val Glu He Val 

195 200 205 

ccg ggc att ctg cca gta teg aac ttc aaa cag ttg cag aaa ttt gee 

Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Leu Gin Lys Phe Ala 

210 215 220 

acg atg acc aac gtc cgt gtg ccg aac tgg atg acg acc atg ttt gac 

Thr Met Thr Asn Val Arg Val Pro Asn Trp Met Thr Thr Met Phe Asp 

225 230 235 240 



gc ctg gat aac gat cca gaa acc cgc aaa atg gtg ggg gcg tct ate 
"y Leu Asp Asn Asp Pro Glu Thr Arg Lys Met Val Gly Ala Ser He 
245 250 * 255 



gee atg gat atg gtg aaa att etc age cgc gaa ggc gta aaa gat ttc 
Ala Met Asp Met Val Lys lie Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 ^ 270 

cat ttc tat acg ctg aac cgc gcg gag ctg age tat gcg att tgc cat 
His Phe Tyr Thr Leu Asn Arg Ala Glu Leu Ser Tyr Ala He Cys His 
275 280 285 

acg ctg ggc gtc cgc cct gat gta gca cgc tga 
Thr Leu Gly Val Arg Pro Asp Val Ala Arg 
290 295 



<210> 26 
<211> 298 
<212> PRT 
<213> Erwinia 

<400> 26 

M/43126 



carotovora 



288 



336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



897 
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Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

Ala Glu Leu Gin Gly Arg He Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

Arg Thr Ser Asp Met Glu Glu Thr Leu Trp Ser Ser He Asp Arg Leu 
35 40 45 

Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

Gly Glu Arg Asp Arg Thr His Ser He He Lys Thr He Lys Glu Arg 
65 70 75 80 

Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Ser Arg 
85 90 95 

Glu Gin Leu Arg Glu He Ala Gin Asp Tyr Trp Glu Ser Gly He Arg 
100 105 110 

s He Val Ala Leu Arg Gly Asp Leu Pro Gin Glu Gly Gly Lys Pro 
115 120 125 

Asp Met Tyr Ala Ala Asp Leu Val Ser Leu Leu Lys Glu Val Gly Asp 
130 135 140 

Phe Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

Ser Ala Gin Ala Asp Leu lie Asn Leu Lys His Lys He Asp Ala Gly 
165 170 175 

Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

Arg Phe Arg Asp Arg Cys Val Ala Thr Gly He Asp Val Glu He Val 
195 200 205 



Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Leu Gin Lys Phe Ala 
210 215 220 



r Met Thr Asn Val Arg Val Pro Asn Trp Met Thr Thr Met Phe Asp 
225 230 235 240 

Gly Leu Asp Asn Asp Pro Glu Thr Arg Lys Met Val Gly Ala Ser He 
245 250 255 

Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 

His Phe Tyr Thr Leu Asn Arg Ala Glu Leu Ser Tyr Ala He Cys His 
275 280 285 

Thr Leu Gly Val Arg Pro Asp Val Ala Arg 
290 295 



<210> 27 
<211> 888 
<212> DNA 
<213> Klebsiella 



pneumoniae 
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<220> 
<221> CDS 
<222> (1) . . (885) 
<223> RKP07488 



™G1 



<400> 27 

atg age ttt ttt cac gec aat cag egg gaa gec ctg aat cag age ctg 4 8 
Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

gcg gaa gtc cag ggc cag att aat gtg tct ttt gaa ttc ttt ccg ccg 96 
Ala Glu Val Gin Gly Gin lie Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

cgc acc agt gaa atg gag caa acc ctg tgg aaa tec ate gat cgc ctg 144 
Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Lys Ser lie Asp Arg Leu 
35 40 45 

age agt ctg aaa ccg aag ttt gtt teg gta acc tat ggc gcg aac tct 192 
Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 



c gag cgc gat cgc acc cac age ate ate aaa ggc att aaa gag cga 24 0 
ly Glu Arg Asp Arg Thr His Ser lie lie Lys Gly lie Lys Glu Arg 
65 70 75 80 

acc ggt ctg gaa gca gcg ccg cac ctg acc tgt ate gat gec age cgc 2 88 
Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys lie Asp Ala Ser Arg 
85 90 95 

gat gag ttg cgc act ate get cag gat tac tgg aac aac ggt ate cgc 33 6 
Asp Glu Leu Arg Thr lie Ala Gin Asp Tyr Trp Asn Asn Gly lie Arg 
100 105 110 

cat ate gtc gee ctg cgc ggc gac ctg ccg ccg ggc age ggt aaa ccg 3 84 
His lie Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 125 



^^^^ 



gat atg tac gee gee gat ctg gtg acg ttg ctg aaa gag gta ggc gat 432 
Asp Met Tyr Ala Ala Asp Leu Val Thr Leu Leu Lys Glu Val Gly Asp 
130 135 140 



t gat ate tct gtc gee gcg tat ccg gaa gtg cat ccg gag gcg aaa 48 0 
he Asp lie Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

age gcg cag gcg gat tta ctg aac ctg aag cgc aaa gta gaa gca ggg 528 
Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Glu Ala Gly 
165 170 175 

gee aac cgc gcg ate acc cag ttc ttc ttc gat gtg gaa age tac ctg 576 
Ala Asn Arg Ala lie Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

cgt ttt cgc gat cgc tgc gtc teg gca ggc ate gac gtg gaa ate att 624 
Arg Phe Arg Asp Arg Cys Val Ser Ala Gly lie Asp Val Glu lie He 
195 200 205 

ccc ggt ate ctg ccg gtc tec aac ttt aaa cag gcg aaa aag ttt gcg 672 
Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 

gat atg acc aac gtc cgt ate ccg gtg tgg atg tea aaa atg ttc gaa 72 0 
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Asp Met Thr Asn Val Arg lie Pro Val Trp Met Ser Lys Met Phe Glu 
225 230 235 240 

ggg ctg gat aac gac gcc gaa acc cgt caa ctg gtg ggg gcg aat ate 768 
Gly Leu Asp Asn Asp Ala Glu Thr Arg Gin Leu Val Gly Ala Asn lie 
245 250 255 

gcc atg gac atg gtg aag ate tta age egg gaa ggg gtc aag gat ttc 816 
Ala Met Asp Met Val Lys lie Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 

cac ttc tac acc ctg aac cgc gcc gag atg age tac gcc ate tgc cat 8 64 
His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala lie Cys His 
275 280 * 285 

acg ctg ggc gta cgc ccg gcc tga 8 88 

Thr Leu Gly Val Arg Pro Ala 
290 295 




10> 28 
11> 295 
12 > PRT 
<213> Klebsiella pneumoniae 

<4O0> 28 

Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

Ala Glu Val Gin Gly Gin lie Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Lys Ser lie Asp Arg Leu 
35 40 45 

Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

Gly Glu Arg Asp Arg Thr His Ser lie lie Lys Gly lie Lys Glu Arg 
65 70 75 80 



r Gly Leu Glu Ala Ala Pro His Leu Thr Cys lie Asp Ala Ser Arg 
85 90 95 



Asp Glu Leu Arg Thr lie Ala Gin Asp Tyr Trp Asn Asn Gly lie Arg 
100 105 110 

His lie Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 * 125 

Asp Met Tyr Ala Ala Asp Leu Val Thr Leu Leu Lys Glu Val Gly Asp 
130 135 140 

Phe Asp lie Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Glu Ala Gly 
165 170 175 

Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

Arg Phe Arg Asp Arg Cys Val Ser Ala Gly He Asp Val Glu He He 
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195 200 205 

Pro Gly lie Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 

Asp Met Thr Asn Val Arg lie Pro Val Trp Met Ser Lys Met Phe Glu 
225 230 235 240 

Gly Leu Asp Asn Asp Ala Glu Thr Arg Gin Leu Val Gly Ala Asn lie 
245 250 * 255 

Ala Met Asp Met Val Lys lie Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 

His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala He Cys His 
275 280 285 

Thr Leu Gly Val Arg Pro Ala 
290 295 



10> 29 
11> 891 
<212> DNA 
<213> Salmonella typhi 

<220> 

<221> CDS 

<222> (1) . . (888) 

<223> RTY02485 

<400> 29 

atg age ttt ttt cac gec aac cag egg gaa gec ctg aat cag age ctg 48 
Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

gcg gaa gta cag ggt cag att aac gtt teg ttt gaa ttt ttc ccg ccg 96 
Ala Glu Val Gin Gly Gin He Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 



cgc acc agt gaa atg gag caa acc ctg tgg aac tec ate gat cgc ctg 144 
g Thr Ser Glu Met Glu Gin Thr Leu Trp Asn Ser He Asp Arg Leu 
35 40 45 



age age ctg aaa ccg aag ttt gtt teg gta acg tat ggc gec aac tec 192 
Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

999 gaa cgt gac cgc act cat agt gtt att aaa ggc att aaa gag cgt 240 
Gly Glu Arg Asp Arg Thr His Ser Val He Lys Gly He Lys Glu Arg 
65 70 75 ^ 80 

act ggg ctt gag gec gcg ccg cac ctt acc tgt att gac gee acg cgc 2 88 
Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Thr Arg 
85 90 95 

gat gaa ctg cgc acc ate gec cgc gac tac tgg aat aac ggt ate cgc 33 6 
Asp Glu Leu Arg Thr He Ala Arg Asp Tyr Trp Asn Asn Gly He Arg 
100 105 110 

cac att gtt get ttg cgc ggc gat ttg ccg ccg ggc age ggt aag ccg 3 84 
His He Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 125 
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gag atg tac gcc gcc gat ctg gtt ggt ttg etc aaa gag gtg gtc gat 432 
Glu Met Tyr Ala Ala Asp Leu Val Gly Leu Leu Lys Glu Val Val Asp 
130 135 140 

ttc gat att tea gta gcg gcc tat ccg gag gta cat ccg gaa gcg aaa 480 
Phe Asp lie Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

age gcg cag gcc gat ctg ctt aat ctg aag cgt aaa gtg gat get ggc 52 8 
Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Asp Ala Gly 
165 170 175 

get aac cgc gcg ata acc caa ttt ttc ttc gat gtg gaa age tat ctg 576 
Ala Asn Arg Ala lie Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

cgt ttt cgc gac cgc tgt gtt tec gcc ggt ate gac gta gaa att att 624 
Arg Phe Arg Asp Arg Cys Val Ser Ala Gly He Asp Val Glu He He 
195 200 205 

c ggc att tta ccg gtg tct aac ttt aaa cag gcg aaa aaa ttt gcc 672 
o Gly He Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 

gat atg acc aat gtc cgc att ccg tec tgg atg teg ctg atg ttt gag 720 
Asp Met Thr Asn Val Arg He Pro Ser Trp Met Ser Leu Met Phe Glu 
225 230 235 240 

ggg ctg gat gat gac gca gaa acc cgc aag ctg gtg ggc get aac att 768 
Gly Leu Asp Asp Asp Ala Glu Thr Arg Lys Leu Val Gly Ala Asn He 
245 250 255 

gcg atg gac atg gtg aaa att tta age cgc gaa gga gtg aag gat ttc 816 
Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 "* 270 

cac ttc tac acg ttg aat cgt gcg gaa atg agt tat gcc att tgc cac 864 
His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala He Cys His 
275 280 * 285 



• 



g ctg ggc gta aga ccg ggt tta taa 891 
r Leu Gly Val Arg Pro Gly Leu 
290 295 



<210> 30 
<211> 296 
<212> PRT 

<213> Salmonella typhi 
<400> 30 

Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

Ala Glu Val Gin Gly Gin He Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Asn Ser He Asp Arg Leu 
35 4 0 45 

Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
5 0 55 60 
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Gly Glu Arg Asp Arg Thr His Ser Val lie Lys Gly lie Lys Glu Arg 
65 70 75 80 

Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys lie Asp Ala Thr Arg 
85 90 95 

Asp Glu Leu Arg Thr lie Ala Arg Asp Tyr Trp Asn Asn Gly He Arg 
100 105 110 

His He Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 125 

Glu Met Tyr Ala Ala Asp Leu Val Gly Leu Leu Lys Glu Val Val Asp 
130 135 140 

Phe Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 




Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Asp Ala Gly 
165 170 " 175 

a Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 



Arg Phe Arg Asp Arg Cys Val Ser Ala Gly He Asp Val Glu He He 

195 200 205 

Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 

210 215 ~ 220 

Asp Met Thr Asn Val Arg He Pro Ser Trp Met Ser Leu Met Phe Glu 

225 230 235 240 

Gly Leu Asp Asp Asp Ala Glu Thr Arg Lys Leu Val Gly Ala Asn He 

245 250 255 

Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Asp Phe 

260 265 * 270 




gis Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala He Cys His 
275 280 285 

hr Leu Gly Val Arg Pro Gly Leu 
290 295 



<210> 31 
<211> 891 
<212> DNA 

<213> Salmonella typhimurium 

<220> 

<221> CDS 

<222> (1) . . (888) 

<223> RSY00593 

<400> 31 

atg age ttt ttt cac gec aac cag 
Met Ser Phe Phe His Ala Asn Gin 
1 5 

gcg gaa gta cag ggt cag att aac 



egg gaa gec ctg aat cag age ctg 48 
Arg Glu Ala Leu Asn Gin Ser Leu 
10 15 

gtt teg ttt gaa ttt ttc ccg ccg 96 
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Ala Glu Val Gin Gly Gin lie Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

cgc acc agt gaa atg gag caa acc ctg tgg aac tec ate gat cgc ctg 144 
Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Asn Ser He Asp Arg Leu 



35 40 



45 



age agt ctg aaa ccg aag ttt gtt teg gta acg tat ggc gee aac tec 192 
Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

ggg gaa cgc gac cgc acc cat age gtt att aaa ggc ate aaa gag cgt 240 
Gly Glu Arg Asp Arg Thr His Ser Val He Lys Gly He Lys Glu Arc 
65 70 75 80 

act ggg ctt gag gec gcg ccg cac ctt acc tgt att gac gee acg cgc 288 
Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Thr Arc, 
85 90 95 

gat gaa ctg cgc acc ate gec cgc gac tac tgg aat aac ggt ate cgc 336 
p Glu Leu Ar 9 Thr He Ala Arg Asp Tyr Trp Asn Asn Gly He Arg 
100 105 no 

w*= S! !? fc ^ 9 C9 ° 990 9at tt9 CC9 CC9 " c agc 99 fc aa 9 <=cg 384 

His He Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 

115 120 125 

Z*? I 30 9 f C 9CC 9at btg 9tt 99t ttg ctc aaa sag gtg gee gat 432 
Glu Met Tyr Ala Ala Asp Leu Val Gly Leu Leu Lys Glu Val Ala Asp 
130 135 140 




^° 9at « * tCa 9ta 9C9 9CC tat CC9 9a 9 9 ta cat cc 9 3aa gcg aaa 
Phe Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 



480 



155 160 



5~ 9 ? 9 ^ 9 9 f C 9at Ct9 Ctt aat Ct9 aa9 C9t aaa 9 fc 9 9 a t get ggc 528 
Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Asp Ala Gly 



165 170 



175 




get aac cgc gcg ata acc caa ttt ttc ttc gat gtg gaa age tac ctg 
Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
5 180 185 



576 



190 



S™ 9SC ° 9C t9t 9tt tCt 9CC 99t atC 9aC 9ta g aa att a " 624 

Arg Phe Arg Asp Arg Cys Val Ser Ala Gly He Asp Val Glu He He 

195 200 



205 



111 r? C r ta C ° 9 9t ? tCt aaC fctt aaa ca 9 9 ca aaa aa a ttt gee 

Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 



672 



220 



IZ m ? SH" ^ 9 ° CgC att CC9 tcc tgg afc g tca ct g atg ttt gag 720 
Asp Met Thr Asn Val Arg He Pro Ser Trp Met Ser Leu Met Phe 111 
225 230 235 240 

ggg ctg gat aat gac gca gaa acc cgc aag ctg gtg ggc get aac att 768 
Gly Leu Asp Asn Asp Ala Glu Thr Arg Lys Leu Val Gly Ala Asn He 
245 250 255 

9 ? 9 M t9 ? aC at9 9t9 aaa att tta agc cgt gaa gg a gtg aag gat ttc 816 

Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Isp Phe 
260 265 270 
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cac ttc tac acg ttg aat cgt gcg gaa atg agt tat gcc att tgc cac 864 
His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala lie Cys His 
275 280 285 

acg ctg ggc gta aga ccg ggt tta taa 891 
Thr Leu Gly Val Arg Pro Gly Leu 
290 295 



<210> 32 
<211> 296 
<212> PRT 

<213> Salmonella typhimurium 
<400> 32 

Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

Ala Glu Val Gin Gly Gin lie Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 



Thr Ser Glu Met Glu Gin Thr Leu Trp Asn Ser lie Asp Arg Leu 
35 40 45 



Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

Gly Glu Arg Asp Arg Thr His Ser Val He Lys Gly He Lys Glu Arg 
65 70 75 80 

Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Thr Arg 
85 90 95 

Asp Glu Leu Arg Thr He Ala Arg Asp Tyr Trp Asn Asn Gly He Arg 
100 105 110 

His He Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 12 0 125 



4i 



Glu Met Tyr Ala Ala Asp Leu Val Gly Leu Leu Lys Glu Val Ala Asp 
130 135 140 



e Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
45 150 155 160 

Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Asp Ala Gly 
165 170 175 

Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 ~ 190 

Arg Phe Arg Asp Arg Cys Val Ser Ala Gly He Asp Val Glu He He 
195 200 " 205 

o 

Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 



Asp Met Thr Asn Val Arg He Pro Ser Trp Met Ser Leu Met Phe Glu 
225 230 235 240 

Gly Leu Asp Asn Asp Ala Glu Thr Arg Lys Leu Val Gly Ala Asn He 
245 250 ~ 255 
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Ala Met Asp Met Val Lys lie Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 

His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala lie Cys HiB 
275 280 285 

Thr Leu Gly Val Arg Pro Gly Leu 
2 90 295 





<210> 33 
<211> 891 
<212> DNA 

<213> Escherichia coli 

<220> 
<221> CDS 
<222> (1) . . (888) 
<223> REC03839 

00> 33 

g age ttt ttt cac gec age cag egg gat gec ctg aat cag age ctg 48 
t Ser Phe Phe His Ala Ser Gin Arg Asp Ala Leu Asn Gin Ser Leu 
15 10 15 

gca gaa gtc cag ggg cag att aac gtt teg ttc gag ttt ttc ccg ccg 96 
Ala Glu Val Gin Gly Gin lie Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

cgt ace agt gaa atg gag cag ace ctg tgg aac tec ate gat cgc ctt 144 
Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Asn Ser lie Asp Arg Leu 
35 40 45 

age age ctg aaa ccg aag ttt gta teg gtg acc tat ggc gcg aac tec 192 
Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 

50 55 60 

ggc gag cgc gac cgt acg cac age att att aaa ggc att aaa gat cgc 240 
Gly Glu Arg Asp Arg Thr His Ser lie lie Lys Gly lie Lys Asp Arg 
65 70 75 80 

et ggt ctg gaa gcg gca ccg cat ctt act tgc att gat gcg acg ccc 2 88 
Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys lie Asp Ala Thr Pro 
85 90 95 

gac gag ctg cgc acc att gca cgc gac tac tgg aat aac ggt att cgt 336 
Asp Glu Leu Arg Thr lie Ala Arg Asp Tyr Trp Asn Asn Gly lie Arg 
100 105 110 

cat ate gtg gcg ctg cgt ggc gat ctg ccg ccg gga agt ggt aag cca 3 84 
His He Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 125 

gaa atg tat get tct gac ctg gtg acg ctg tta aaa gaa gtg gca gat 432 
Glu Met Tyr Ala Ser Asp Leu Val Thr Leu Leu Lys Glu Val Ala Asp 
130 135 140 

ttc gat ate tec gtg gcg gcg tat ccg gaa gtt cac ccg gaa gca aaa 4 80 
Phe Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

age get cag gcg gat ttg ctt aat ctg aaa cgc aaa gtg gat gee gga 528 
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Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Asp Ala Gly 
165 170 " 175 

gcc aac cgc gcg att act cag ttc ttc ttc gat gtc gaa age tac ctg 576 
Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

cgt ttt cgt gac cgc tgt gta teg gcg ggc att gat gtg gaa att att 624 
Arg Phe Arg Asp Arg Cys Val Ser Ala Gly He Asp Val Glu He He 
195 200 * 205 

ccg gga att ttg ccg gta tct aac ttt aaa cag gcg aag aaa ttt gcc 672 
Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 

gat atg acc aac gtg cgt att ccg gcg tgg atg gcg caa atg ttc gac 720 
Asp Met Thr Asn Val Arg He Pro Ala Trp Met Ala Gin Met Phe Asp 
225 230 235 240 

ggt ctg gat gat gat gcc gaa acc cgc aaa ctg gtt ggc gcg aat att 768 
Jy Leu Asp Asp Asp Ala Glu Thr Arg Lys Leu Val Gly Ala Asn He 
245 250 255 

gcc atg gat atg gtg aag att tta age cgt gaa gga gtg aaa gat ttc 816 
Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 ~* 270 

cac ttc tat acg ctt aac cgt get gaa atg agt tac gcg att tgc cat 864 
His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala He Cys His 
275 280 ^ 285 

acg ctg ggg gtt cga cct ggt tta taa 891 
Thr Leu Gly Val Arg Pro Gly Leu 
290 295 



<210> 34 
<211> 296 
<212> PRT 

<213> Escherichia coli 



# 



00> 34 

fet Ser Phe Phe His Ala Ser Gin Arg Asp Ala Leu Asn Gin Ser Leu 
5 10 15 



Ala Glu Val Gin Gly Gin He Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Asn Ser He Asp Arg Leu 
35 40 45 

Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

Gly Glu Arg Asp Arg Thr His Ser He He Lys Gly He Lys Asp Arg 
65 70 75 * 80 

Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Thr Pro 
85 90 95 



Asp Glu Leu Arg Thr He Ala Arg Asp Tyr Trp Asn Asn Gly He Arg 
100 105 110 
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His lie Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 125 

Glu Met Tyr Ala Ser Asp Leu Val Thr Leu Leu Lys Glu Val Ala Asp 
130 135 140 

Phe Asp lie Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Asp Ala Gly 
165 170 175 

Ala Asn Arg Ala lie Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

Arg Phe Arg Asp Arg Cys Val Ser Ala Gly lie Asp Val Glu lie lie 
195 200 205 

Pro Gly lie Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 

p Met Thr Asn Val Arg He Pro Ala Trp Met Ala Gin Met Phe Asp 
5 230 235 240 

Gly Leu Asp Asp Asp Ala Glu Thr Arg Lys Leu Val Gly Ala Asn He 
245 250 255 

Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 

His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala He Cys His 
275 280 285 

Thr Leu Gly Val Arg Pro Gly Leu 
290 295 



<210> 35 
<211> 915 
<212> DNA 

<213> Vibrio cholerae 



20> 
<221> CDS 
<222> (1) . . (912) 
<223> RVC06433 

<400> 35 

gtg aca etc ggt cac agg gag tac aag atg gga tac aca cac get age 48 

Val Thr Leu Gly His Arg Glu Tyr Lys Met Gly Tyr Thr His Ala Ser 
1 5 10 15 

cat ate gat gca ttg aac caa aac att gcg gag ctt tec gac ate aat 96 
His He Asp Ala Leu Asn Gin Asn He Ala Glu Leu Ser Asp He Asn 
20 25 30 

gtt teg ttt gag ttt ttt cca ccc age tea cca caa atg gaa gaa acg 144 
Val Ser Phe Glu Phe Phe Pro Pro Ser Ser Pro Gin Met Glu Glu Thr 
35 40 45 

ctt tgg gga teg gta cac cgt ctg aaa aca etc caa ccg aaa ttt gtt 192 
Leu Trp Gly Ser Val His Arg Leu Lys Thr Leu Gin Pro Lys Phe Val 
50 55 60 
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teg gtc act tat ggt gca aac tct ggt gag cgt gac cgt act cac teg 

Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu Arg Asp Arg Thr His Ser 

65 70 75 80 

ate att aaa gcg ate aaa gat caa acc ggt tta att gee gcg cca cac 

lie lie Lys Ala lie Lys Asp Gin Thr Gly Leu lie Ala Ala Pro His 

85 90 95 

ctg act tgt ate gat gee act cgt gat gaa ctg ate cag ate gec gat 

Leu Thr Cys He Asp Ala Thr Arg Asp Glu Leu He Gin He Ala Asp 

100 105 110 

gac tac tgg cat aac ggc ate cag aat att gtg gcg ctg cgt ggg gat 

Asp Tyr Trp His Asn Gly lie Gin Asn He Val Ala Leu Arg Gly Asp 

115 120 125 

ate ccg get ggc ggt ggt aag cca gag atg tac gee tec gat eta gtg 

He Pro Ala Gly Gly Gly Lys Pro Glu Met Tyr Ala Ser Asp Leu Val 

130 135 140 



ctg etc aaa tea cgc cac gat ttt gat att tec gtg gee gee ttc 
r Leu Leu Lys Ser Arg His Asp Phe Asp He Ser Val Ala Ala Phe 
45 150 155 160 



cct gaa gtg cac cct gaa gee aaa age gcg caa gcg gac ctg etc aat 
Pro Glu Val His Pro Glu Ala Lys Ser Ala Gin Ala Asp Leu Leu Asn 
165 170 175 

tta aaa cgt aaa gtc gat gca ggt gcg aat cgt gee ate acg cag ttt 
Leu Lys Arg Lys Val Asp Ala Gly Ala Asn Arg Ala He Thr Gin Phe 
180 185 190 

ttc ttt gat gta gaa age tac ctg cgt ttt cgc gat cgc tgt gtg gee 
Phe Phe Asp Val Glu Ser Tyr Leu Arg Phe Arg Asp Arg Cys Val Ala 
195 200 205 

get ggg att gac gta gaa ate gtg cct ggc att ctg ccg gtt tct aac 
Ala Gly He Asp Val Glu He Val Pro Gly He Leu Pro Val Ser Asn 
210 215 220 



2; 



t aaa caa gcg teg cgc ttc get gcg caa aac aac gtc aaa gtt ccg 
e Lys Gin Ala Ser Arg Phe Ala Ala Gin Asn Asn Val Lys Val Pro 
25 230 235 240 

aat tgg atg gtg aag cag ttt gaa gga tta gaa gac gat cca gtg act 
Asn Trp Met Val Lys Gin Phe Glu Gly Leu Glu Asp Asp Pro Val Thr 
245 250 255 

cgc cag ttg gta ggt gca age caa gee att gat atg gtg cgc gtg ctg 
Arg Gin Leu Val Gly Ala Ser Gin Ala He Asp Met Val Arg Val Leu 
260 265 270 

tgc cgt gaa ggg gtg aag gat ttc cac ttc tac acc eta aat cgt gee 
Cys Arg Glu Gly Val Lys Asp Phe His Phe Tyr Thr Leu Asn Arg Ala 
275 280 285 

gaa atg act tac gcg tta tgc cac acc tta ggc gtt cgc cca caa get 
Glu Met Thr Tyr Ala Leu Cys His Thr Leu Gly Val Arg Pro Gin Ala 
290 295 300 

taa 
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<210> 36 
<211> 304 
<212> PRT 

<213> Vibrio cholerae 




<400> 36 

Val Thr Leu Gly His Arg Glu Tyr Lys Met Gly Tyr Thr His Ala Ser 
1 5 10 15 

His lie Asp Ala Leu Asn Gin Asn He Ala Glu Leu Ser Asp He Asn 
20 25 30 

Val Ser Phe Glu Phe Phe Pro Pro Ser Ser Pro Gin Met Glu Glu Thr 
35 40 45 

Leu Trp Gly Ser Val His Arg Leu Lys Thr Leu Gin Pro Lys Phe Val 
50 55 60 

Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu Arg Asp Arg Thr His Ser 
£5 70 75 80 

e He Lys Ala He Lys Asp Gin Thr Gly Leu He Ala Ala Pro His 
85 90 95 

Leu Thr Cys He Asp Ala Thr Arg Asp Glu Leu He Gin He Ala Asp 
100 105 110 

Asp Tyr Trp His Asn Gly He Gin Asn He Val Ala Leu Arg Gly Asp 
115 120 125 

He Pro Ala Gly Gly Gly Lys Pro Glu Met Tyr Ala Ser Asp Leu Val 
130 135 140 

Thr Leu Leu Lys Ser Arg His Asp Phe Asp He Ser Val Ala Ala Phe 
X45 150 155 160 

Pro Glu Val His Pro Glu Ala Lys Ser Ala Gin Ala Asp Leu Leu Asn 
165 170 175 



eu Lys Arg Lys Val Asp Ala Gly Ala Asn Arg Ala He Thr Gin Phe 
180 185 190 



Phe Phe Asp Val Glu Ser Tyr Leu Arg Phe Arg Asp Arg Cys Val Ala 
195 200 205 

Ala Gly He Asp Val Glu He Val Pro Gly He Leu Pro Val Ser Asn 
210 215 220 

Phe Lys Gin Ala Ser Arg Phe Ala Ala Gin Asn Asn Val Lys Val Pro 
225 230 235 ~ 240 

Asn Trp Met Val Lys Gin Phe Glu Gly Leu Glu Asp Asp Pro Val Thr 
245 250 255 

Arg Gin Leu Val Gly Ala Ser Gin Ala He Asp Met Val Arg Val Leu 
260 265 270 

Cys Arg Glu Gly Val Lys Asp Phe His Phe Tyr Thr Leu Asn Arg Ala 
275 280 285 

Glu Met Thr Tyr Ala Leu Cys His Thr Leu Gly Val Arg Pro Gin Ala 
290 295 300 
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<210> 37 
<211> 879 
<212> DNA 

<213> Haemophilus influenzae 

<220> 
<221> CDS 
<222> (1) . . (876) 
<223> RHI06620 

<400> 37 

atg age tac gcg aaa gaa att gat aca tta aat caa cat att gca gat 48 
Met Ser Tyr Ala Lys Glu lie Asp Thr Leu Asn Gin His lie Ala Asp 
15 10 15 

ft aat aaa aaa att aat gtc tec ttt gaa ttt ttt cca cct aaa aac 96 
e Asn Lys Lys lie Asn Val Ser Phe Glu Phe Phe Pro Pro Lys Asn 
20 25 30 

gaa aaa atg gaa acc ctt eta tgg gat tea att cat cgt tta aaa gta 144 
Glu Lys Met Glu Thr Leu Leu Trp Asp Ser lie His Arg Leu Lys Val 
35 40 45 

tta aag cct aaa ttt gtg tea gtc act tac ggt gca aat teg gga gaa 192 
Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu 
50 55 60 

cgt gac cgc act cac ggc att gtg aaa gee att aaa caa gaa act ggc 24 0 
Arg Asp Arg Thr His Gly He Val Lys Ala He Lys Gin Glu Thr Gly 
65 70 75 80 

tta gaa gee gca cca cat tta act gga att gat gec aca cct gaa gaa 288 
Leu Glu Ala Ala Pro His Leu Thr Gly He Asp Ala Thr Pro Glu Glu 
85 90 95 



• 



£ta aaa caa att gcg aga gat tat tgg gat agt ggt att cgc cgt att 33 6 
u Lys Gin He Ala Arg Asp Tyr Trp Asp Ser Gly lie Arg Arg He 
100 105 110 



gtt gcg tta cgc ggt gac gaa cct aaa ggt tac gcg aaa aaa cca ttt 3 84 

Val Ala Leu Arg Gly Asp Glu Pro Lys Gly Tyr Ala Lys Lys Pro Phe 
115 120 125 

tat gcg tea gat ctt gtg gaa tta etc cgt tct gtc get gat ttt gat 432 

Tyr Ala Ser Asp Leu Val Glu Leu Leu Arg Ser Val Ala Asp Phe Asp 
130 135 140 

att tct gta gee get tat ccc gaa gtt cat cca gaa gca aaa tec gca 4 80 

He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys Ser Ala 
145 150 155 160 

caa gca gac tta att aat tta aaa cgt aaa att gat gca ggt gca aac 52 8 

Gin Ala Asp Leu He Asn Leu Lys Arg Lys He Asp Ala Gly Ala Asn 

165 170 175 

cac gtc att aca caa ttt ttc ttt gat att gaa aac tac eta cgt ttt 576 

His Val He Thr Gin Phe Phe Phe Asp He Glu Asn Tyr Leu Arg Phe 
180 185 190 
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cgt gat cgt tgt gca tea att ggt att gat act gaa ate gta ccc ggt 624 

Arg Asp Arg Cys Ala Ser He Gly He Asp Thr Glu He Val Pro Gly 
195 200 205 

att tta cct gtt act aat ttt aaa caa etc caa aaa atg gca tea ttc 672 

He Leu Pro Val Thr Asn Phe Lys Gin Leu Gin Lys Met Ala Ser Phe 
210 215 220 

act aat gtg aaa att cca gcg tgg tta gtt aaa gec tat gat ggt ttg 720 

Thr Asn Val Lys He Pro Ala Trp Leu Val Lys Ala Tyr Asp Gly Leu 

225 230 235 240 

gat aat gat cca act aca cgt aat ctt gtg gca gca agt gtt gca atg 768 

Asp Asn Asp Pro Thr Thr Arg Asn Leu Val Ala Ala Ser Val Ala Met 
245 250 255 

gat atg gta aaa att tta tct cgc gaa ggc gtg aat gac ttc cac ttt 816 

Asp Met Val Lys He Leu Ser Arg Glu Gly Val Asn Asp Phe His Phe 
260 265 270 

t aca tta aat cgt agt gaa tta act tat get ate tgt cat atg tta 864 

r Thr Leu Asn Arg Ser Glu Leu Thr Tyr Ala He Cys His Met Leu 
275 280 285 

39t 9 fc a aga cct taa 879 
Gly Val Arg Pro 
290 



<210> 38 
<211> 292 
<212> PRT 

<213> Haemophilus influenzae 
<400> 38 

Met Ser Tyr Ala Lys Glu He Asp Thr Leu Asn Gin His He Ala Asp 
1 5 10 15 



he Asn Lys Lys He Asn Val Ser Phe Glu Phe Phe Pro Pro Lys Asn 
20 25 30 



Glu Lys Met Glu Thr Leu Leu Trp Asp Ser He His Arg Leu Lys Val 

35 40 45 

Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu 

50 55 60 

Arg Asp Arg Thr His Gly He Val Lys Ala He Lys Gin Glu Thr Gly 

65 70 75 80 

Leu Glu Ala Ala Pro His Leu Thr Gly He Asp Ala Thr Pro Glu Glu 

85 90 95 

Leu Lys Gin He Ala Arg Asp Tyr Trp Asp Ser Gly He Arg Arg He 

100 105 ~ 110 

Val Ala Leu Arg Gly Asp Glu Pro Lys Gly Tyr Ala Lys Lys Pro Phe 

115 120 125 

Tyr Ala Ser Asp Leu Val Glu Leu Leu Arg Ser Val Ala Asp Phe Asp 

130 135 140 
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He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys Ser Ala. 
145 150 155 160 

Gin Ala Asp Leu He Asn Leu Lys Arg Lys He Asp Ala Gly Ala Asn 
165 170 ~ 175 

His Val He Thr Gin Phe Phe Phe Asp He Glu Asn Tyr Leu Arg Phe 
180 185 190 

Arg Asp Arg Cys Ala Ser lie Gly He Asp Thr Glu He Val Pro Gly 
195 200 205 

He Leu Pro Val Thr Asn Phe Lys Gin Leu Gin Lys Met Ala Ser Phe 
210 215 220 

Thr Asn Val Lys He Pro Ala Trp Leu Val Lys Ala Tyr Asp Gly Leu 
225 230 235 240 

Asp Asn Asp Pro Thr Thr Arg Asn Leu Val Ala Ala Ser Val Ala Met 
245 250 255 

p Met Val Lys He Leu Ser Arg Glu Gly Val Asn Asp Phe His Phe 
260 265 270 

Tyr Thr Leu Asn Arg Ser Glu Leu Thr Tyr Ala He Cys His Met Leu 
275 280 285 

Gly Val Arg Pro 
290 



<210> 39 
<211> 945 
<212> DNA 

<213> Caulobacter crescentus 

<220> 

<221> CDS 

<222> (1) . . (942) 

^223> RCO02274 



00> 39 

atg acc ctt ccg ccc acc cgc cgc gtg ate ggt ccc gtc gec cga gec 48 

Met Thr Leu Pro Pro Thr Arg Arg Val He Gly Pro Val Ala Arg Ala 
15 10 15 

ggc gag egg acc ggc cgt ccg cgc gtg teg ttc gag ttc ttc ccg ccc 96 
Gly Glu Arg Thr Gly Arg Pro Arg Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

aag act ccg cag atg gaa gag age ctg tgg cag gcg ate aca cgc ctg 144 
Lys Thr Pro Gin Met Glu Glu Ser Leu Trp Gin Ala He Thr Arg Leu 
35 40 45 

gcg ccg ctg gat ccg gec ttc gtc teg gtg acc tat ggc gcg ggc ggc 192 
Ala Pro Leu Asp Pro Ala Phe Val Ser Val Thr Tyr Gly Ala Gly Gly 
50 . 55 60 

tec acc cgc gag cgc acc cac cgc acc gtc aag egg ate ctg gac gag 24 0 
Ser Thr Arg Glu Arg Thr His Arg Thr Val Lys Arg He Leu Asp Glu 
65 70 75 80 
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acc age etc aag ccc gec gcg cac ctg acc tgc gtc ggc gec agt cgc 
Thr Ser Leu Lys Pro Ala Ala His Leu Thr Cys Val Gly Ala Ser Arg 
85 90 95 

gaa gag gtc gat gag gtc att cgc gag tac tgg gag acc ggg gtc cgt 
Glu Glu Val Asp Glu Val lie Arg Glu Tyr Trp Glu Thr Gly Val Arg 
100 105 " 110 

cac ate gtt teg ctg egg ggc gat ccg ccg ccc ggc gag ggc ggc ate 
His lie Val Ser Leu Arg Gly Asp Pro Pro Pro Gly Glu Gly Gly lie 
115 120 125 

ggc ggg gtc tat gtg ccg cgc gec gac ggc tac gec aac gec aca gag 
Gly Gly Val Tyr Val Pro Arg Ala Asp Gly Tyr Ala Asn Ala Thr Glu 
130 135 140 

ttg acc aag gec gtg cgc gcg ate gcg ccg ttc gag gtg ctg gtc ggg 
Leu Thr Lys Ala Val Arg Ala lie Ala Pro Phe Glu Val Leu Val Gly 
14 5 150 155 160 

c tat ccc gag aag cat ccc gag age ccc teg ttg gag cac gac ate 
1 Tyr Pro Glu Lys His Pro Glu Ser Pro Ser Leu Glu His Asp He 
165 170 175 

gac gtc ttg aag cag aag gtc gac gee ggc gcg acg ctg ggg ate age 
Asp Val Leu Lys Gin Lys Val Asp Ala Gly Ala Thr Leu Gly He Ser 
180 185 190 

cag ttc ttc ttc gac etc gac gee ttc ctg cgc ttc gtc gac aag gtg 
Gin Phe Phe Phe Asp Leu Asp Ala Phe Leu Arg Phe Val Asp Lys Val 
195 200 2 05 

cgc gcg gcg ggc ate acc att ccg ate gtg ccg ggg ate atg ccg gtg 
Arg Ala Ala Gly He Thr He Pro He Val Pro Gly He Met Pro Val 
210 215 220 

acc aat ttc gcg ggc ttg aag aag atg gec gec gec tgc cag acg gee 
Thr Asn Phe Ala Gly Leu Lys Lys Met Ala Ala Ala Cys Gin Thr Ala 
22 5 230 235 * 240 



tc ccg tec tgg ctg ggg aac ctg ttc gac ggg ctg gag aac gac gcg 
"e Pro Ser Trp Leu Gly Asn Leu Phe Asp Gly Leu Glu Asn Asp Ala 
245 250 255 



gag acc cgc cgc ctg ate gee tgt teg gtg gec gec gag atg tgc gee 
Glu Thr Arg Arg Leu He Ala Cys Ser Val Ala Ala Glu Met Cys Ala 
260 265 270 

aag ctg cag gaa cag ggt ttc gag gac ttc cac ttc tac acc ctg aac 
Lys Leu Gin Glu Gin Gly Phe Glu Asp Phe His Phe Tyr Thr Leu Asn 
275 280 285 

egg gee gat etc gtt tac gee ate tgc cgt gtg ctg ggc gtg cgc gag 
Arg Ala Asp Leu Val Tyr Ala He Cys Arg Val Leu Gly Val Arg Glu 
290 295 300 

ate teg ccc gee get teg gag gtc gee gca tga 
He Ser Pro Ala Ala Ser Glu Val Ala Ala 
305 310 



<210> 40 
<211> 314 
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336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 



945 
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<212> PRT 

<213> Caulobacter crescentus 
<400> 40 

Met Thr Leu Pro Pro Thr Arg Arg Val lie Gly Pro Val Ala Arg Ala 
15 10 15 

Gly Glu Arg Thr Gly Arg Pro Arg Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

Lys Thr Pro Gin Met Glu Glu Ser Leu Trp Gin Ala He Thr Arg Leu 
35 40 45 

Ala Pro Leu Asp Pro Ala Phe Val Ser Val Thr Tyr Gly Ala Gly Gly 
50 55 60 

Ser Thr Arg Glu Arg Thr His Arg Thr Val Lys Arg lie Leu Asp Glu 
65 70 75 80 

Thr Ser Leu Lys Pro Ala Ala His Leu Thr Cys Val Gly Ala Ser Arg 
85 90 95 

u Glu Val Asp Glu Val He Arg Glu Tyr Trp Glu Thr Gly Val Arg 
100 105 110 

His He Val Ser Leu Arg Gly Asp Pro Pro Pro Gly Glu Gly Gly He 
115 120 125 

Gly Gly Val Tyr Val Pro Arg Ala Asp Gly Tyr Ala Asn Ala Thr Glu 
130 135 140 

Leu Thr Lys Ala Val Arg Ala He Ala Pro Phe Glu Val Leu Val Gly 
145 150 . 155 160 

Val Tyr Pro Glu Lys His Pro Glu Ser Pro Ser Leu Glu His Asp He 
165 170 175 

Asp Val Leu Lys Gin Lys Val Asp Ala Gly Ala Thr Leu Gly He Ser 
180 185 190 

In Phe Phe Phe Asp Leu Asp Ala Phe Leu Arg Phe Val Asp Lys Val 
195 200 2 05 

Xrg Ala Ala Gly He Thr He Pro He Val Pro Gly He Met Pro Val 
210 215 220 

Thr Asn Phe Ala Gly Leu Lys Lys Met Ala Ala Ala Cys Gin Thr Ala 
225 230 235 240 

He Pro Ser Trp Leu Gly Asn Leu Phe Asp Gly Leu Glu Asn Asp Ala 
245 250 255 

Glu Thr Arg Arg Leu He Ala Cys Ser Val Ala Ala Glu Met Cys Ala 
260 265 270 

Lys Leu Gin Glu Gin Gly Phe Glu Asp Phe His Phe Tyr Thr Leu Asn 
275 280 285 

Arg Ala Asp Leu Val Tyr Ala He Cys Arg Val Leu Gly Val Arg Glu 
290 295 300 

He Ser Pro Ala Ala Ser Glu Val Ala Ala 
305 310 
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<210> 41 
<211> 885 
<212> DNA 

<213> Actinobacillus act inomycetemcomi tans 

<220> 

<221> CDS 

<222> (1) . . (882) 

<223> RAB00260 

<400> 41 

atg agt tac gca aaa gaa att gat aat eta aat caa cat tta get gat 4 8 
Met Ser Tyr Ala Lys Glu He Asp Asn Leu Asn Gin His Leu Ala Asp 
15 10 15 




tta aac ggc aaa att aat gtc tct ttt gaa ttt ttc ccg ccg aaa agt 96 

Leu Asn Gly Lys He Asn Val Ser Phe Glu Phe Phe Pro Pro Lys Ser 
20 25 30 

a aaa atg gaa aat ctt ctg tgg gaa tec ate cat cgc tta aaa gtg 144 

Glu Lys Met Glu Asn Leu Leu Trp Glu Ser He His Arg Leu Lys Val 

35 40 45 

eta aaa ccg aaa ttt gta tec gtg act tac ggc gec aat tec ggc gag 192 

Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu 
50 55 60 

cgt gaa cgc act cac ggg gtg gtg aaa cgc att aag cag gaa acc ggt 240 

Arg Glu Arg Thr His Gly Val Val Lys Arg He Lys Gin Glu Thr Gly 
65 70 75 80 

ctg gaa get gcg ccg cat tta acc ggt att gac get acc teg gac gaa 288 

Leu Glu Ala Ala Pro His Leu Thr Gly He Asp Ala Thr Ser Asp Glu 
85 90 95 

ttg cgt cgc att gec aaa ggt tat tgg gat age ggc att cgt cgc att 336 

Leu Arg Arg He Ala Lys Gly Tyr Trp Asp Ser Gly He Arg Arg He 
100 105 " 110 



g gca ctg cgc ggt gac gag ccg aaa ggc tac gag aaa aaa cca ttt 3 84 
r al Ala Leu Arg Gly Asp Glu Pro Lys Gly Tyr Glu Lys Lys Pro Phe 
115 120 . 125 

tat gee gee gat tta gta gca tta tta cgt gac gta tea gat ttt gat 432 

Tyr Ala Ala Asp Leu Val Ala Leu Leu Arg Asp Val Ser Asp Phe Asp 
130 135 ** 140 

att tec gtg gcg gca tac cct gag gtt cat ccg gaa gee aaa teg gcg 480 

He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys Ser Ala 

145 150 155 160 

caa gcg gat tta att aat tta aaa cgt aaa att gat gec ggt gee aat 52 8 

Gin Ala Asp Leu He Asn Leu Lys Arg Lys He Asp Ala Gly Ala Asn 
165 170 " 175 

cat gtg ate aca caa ttc ttt ttc gat att gac age tat ctg egg ttc 576 

His Val He Thr Gin Phe Phe Phe Asp He Asp Ser Tyr Leu Arg Phe 
180 185 190 

cgc gat cgc tgc gcg tct ate ggt att gat gca gaa ate gtg ccg ggg 624 
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Arg Asp Arg Cys Ala Ser lie Gly lie Asp Ala Glu lie Val Pro Gly 
195 200 205 

att ctg ccg gtg acc aac ttc aaa caa tta caa aaa atg gca gca ate 672 
lie Leu Pro Val Thr Asn Phe Lys Gin Leu Gin Lys Met Ala Ala He 
210 215 220 

act aat gtg aaa att cca get tgg atg age aaa atg tat gaa ggc ttg 720 
Thr Asn Val Lys He Pro Ala Trp Met Ser Lys Met Tyr Glu Gly Leu 
225 230 235 240 

gat gat gac caa acc acc cgc aat ctg gtg gcg gcg age ate gee atg 768 
Asp Asp Asp Gin Thr Thr Arg Asn Leu Val Ala Ala Ser He Ala Met 
245 250 255 

gac atg gtg cgt gta ctg tec cgc gaa ggg gta aaa gac ttt cat ttc 816 
Asp Met Val Arg Val Leu Ser Arg Glu Gly Val Lys Asp Phe His Phe 
260 265 270 

tac acc ctg aat cgc agt gaa etc acc tat get att tgc cac acg tta 864 
r Thr Leu Asn Arg Ser Glu Leu Thr Tyr Ala He Cys His Thr Leu 
275 280 285 

ggc att cgt ccg agt ttg taa 885 
Gly He Arg Pro Ser Leu 
290 



<210> 42 
<211> 294 
<212> PRT 

<213> Actinobacillus actinomycetemcomitans 
<400> 42 

Met Ser Tyr Ala Lys Glu He Asp Asn Leu Asn Gin His Leu Ala Asp 
15 10 15 

Leu Asn Gly Lys He Asn Val Ser Phe Glu Phe Phe Pro Pro Lys Ser 
20 25 30 



glu Lys Met Glu Asn Leu Leu Trp Glu Ser He His Arg Leu Lys Val 
35 40 45 



eu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu 
50 55 60 

Arg Glu Arg Thr His Gly Val Val Lys Arg He Lys Gin Glu Thr Gly 
65 70 75 80 

Leu Glu Ala Ala Pro His Leu Thr Gly He Asp Ala Thr Ser Asp Glu 
85 90 95 

Leu Arg Arg He Ala Lys Gly Tyr Trp Asp Ser Gly He Arg Arg He 
100 105 110 

Val Ala Leu Arg Gly Asp Glu Pro Lys Gly Tyr Glu Lys Lys Pro Phe 
115 120 - 125 

Tyr Ala Ala Asp Leu Val Ala Leu Leu Arg Asp Val Ser Asp Phe Asp 
130 135 140 

He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys Ser Ala 
14 5 150 155 ~ 160 

M/43126 MetF 



Gin Ala Asp Leu He Asn Leu Lys Arg Lys He Asp Ala Gly Ala Asn 

165 170 * 175 

His Val He Thr Gin Phe Phe Phe Asp He Asp Ser Tyr Leu Arg Phe 

180 185 190 

Arg Asp Arg Cys Ala Ser He Gly He Asp Ala Glu He Val Pro Gly 

195 200 205 

He Leu Pro Val Thr Asn Phe Lys Gin Leu Gin Lys Met Ala Ala He 

210 215 220 

Thr Asn Val Lys He Pro Ala Trp Met Ser Lys Met Tyr Glu Gly Leu 

225 230 235 240 

Asp Asp Asp Gin Thr Thr Arg Asn Leu Val Ala Ala Ser He Ala Met 

245 250 255 

Asp Met Val Arg Val Leu Ser Arg Glu Gly Val Lys Asp Phe His Phe 

260 265 270 



Thr Leu Asn Arg Ser Glu Leu Thr Tyr Ala He Cys His Thr Leu 
275 280 285 



Gly He Arg Pro Ser Leu 
290 



<210> 43 

<211> 867 

<212> DNA 

<213> Rhodobacter 

<220> 

<221> CDS 

<222> (1) . . (864) 

<223> RRC03981 



<400> 43 

i:g acc acg ccg cat gtc age ttt gaa ttc ttc ccg ccg cag acg etc 48 

t Thr Thr Pro His Val Ser Phe Glu Phe Phe Pro Pro Gin Thr Leu 

1 5 10 15 



gac gec teg ttc egg ctg tgg gag acg gcg cag gtt ctg gcg ccg etc 96 
Asp Ala Ser Phe Arg Leu Trp Glu Thr Ala Gin Val Leu Ala Pro Leu 
20 25 30 

aag ccc ggc ttc gtc teg gtc acc tat ggc gcg ggc ggc acc acc cgc 144 
Lys Pro Gly Phe Val Ser Val Thr Tyr Gly Ala Gly Gly Thr Thr Arg 
35 40 45 

aag ctg acg cat gag gee gtg gcg gcg ate cac aag aat tac ggc ctg 192 
Lys Leu Thr His Glu Ala Val Ala Ala He His Lys Asn Tyr Gly Leu 
50 55 60 

aac gtc gee gcg cat ctg acc tgc gtc gat gcg acc egg gee gaa acg 240 
Asn Val Ala Ala His Leu Thr Cys Val Asp Ala Thr Arg Ala Glu Thr 
65 70 75 80 

caa gag ate ate gac gee tat gee gag get ggc gtc acc gag att gtc 2 88 
Gin Glu He He Asp Ala Tyr Ala Glu Ala Gly Val Thr Glu He Val 
85 90 95 
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gcg ctg cgc ggt gat ccg ccg aaa ggc gcc gcc cgc ttc acg ccg cat 
Ala Leu Arg Gly Asp Pro Pro Lya Gly Ala Ala Arg Phe Thr Pro His 
100 105 110 

ccg gac ggg ttt gcc tec teg gtg gac etc ate gaa tgg ctg gcg egg 
Pro Asp Gly Phe Ala Ser Ser Val Asp Leu lie Glu Trp Leu Ala Arg 
115 120 125 

gac ggc cgc ttc acg ctg cgc tgc ggc gcc tat ccg gaa ccg cat ccg 
Asp Gly Arg Phe Thr Leu Arg Cys Gly Ala Tyr Pro Glu Pro His Pro 
130 135 140 

gaa gcc gcc gac acg ctg gcc gac gtg cgc tgg ctg aaa cgc aaa tgc 
Glu Ala Ala Asp Thr Leu Ala Asp Val Arg Trp Leu Lys Arg Lys Cys 
145 150 155 ~ 160 

gag gcg ggg gcg ace teg gcg ate acg caa ttc ttc ttt gaa gcc gag 
Glu Ala Gly Ala Thr Ser Ala lie Thr Gin Phe Phe Phe Glu Ala Glu 
165 170 175 



• 



ttc ttc cgc ttc cgc gac gcc tgc gtg aag gaa ggg ate acc gcc 
Phe Phe Arg Phe Arg Asp Ala Cys Val Lys Glu Gly He Thr Ala 
180 185 190 



aag ate ate ccg ggc ate ctg ccg ate cag tec tgg aaa ggc gcc aag 
Lys He He Pro Gly He Leu Pro He Gin Ser Trp Lys Gly Ala Lys 
195 200 205 

age ttt gcg cag cgc tgc ggc acc teg ate ccg acc tgg gtc gaa gag 
Ser Phe Ala Gin Arg Cys Gly Thr Ser He Pro Thr Trp Val Glu Glu 
210 215 220 

gcc ttt gac cat gcg ate cgc gac gac cgc gaa cag ctg ctg gcc acg 
Ala Phe Asp His Ala He Arg Asp Asp Arg Glu Gin Leu Leu Ala Thr 
225 230 235 240 

gcg ctg tgc acg gag etc tgc gac aac ctg ate gcg ggc ggg gtg gag 
Ala Leu Cys Thr Glu Leu Cys Asp Asn Leu He Ala Gly Gly Val Glu 
245 250 255 



• 



t ctg cat ttc tac acg ctg aac egg ccg cag atg acc cgc gat gtc 
f sp Leu His Phe Tyr Thr Leu Asn Arg Pro Gin Met Thr Arg Asp Val 
260 265 270 



tgc cat gcg ctg ggc gtc aac ccg ggt gtg gtg ctg gaa aac gtc gcc 
Cys His Ala Leu Gly Val Asn Pro Gly Val Val Leu Glu Asn Val Ala 
275 280 285 

tga 



<210> 44 

<211> 288 

<212> PRT 

<213> Rhodobacter 

<400> 44 

Met Thr Thr Pro His Val Ser Phe Glu Phe Phe Pro Pro Gin Thr Leu 
15 10 15 

Asp Ala Ser Phe Arg Leu Trp Glu Thr Ala Gin Val Leu Ala Pro Leu 
20 25 30 
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Lys Pro Gly Phe Val Ser Val Thr Tyr Gly Ala Gly Gly Thr Thr Arg 
35 40 45 

Lys Leu Thr His Glu Ala Val Ala Ala lie His Lys Asn Tyr Gly Leu 
50 55 60 

Asn Val Ala Ala His Leu Thr Cys Val Asp Ala Thr Arg Ala Glu Thr 
65 70 75 80 

Gin Glu He He Asp Ala Tyr Ala Glu Ala Gly Val Thr Glu He Val 
85 90 95 

Ala Leu Arg Gly Asp Pro Pro Lys Gly Ala Ala Arg Phe Thr Pro His 
100 105 110 

Pro Asp Gly Phe Ala Ser Ser Val Asp Leu He Glu Trp Leu Ala Arg 
115 120 125 

Asp Gly Arg Phe Thr Leu Arg Cys Gly Ala Tyr Pro Glu Pro His Pro 
130 135 140 



• 



Ala Ala Asp Thr Leu Ala Asp Val Arg Trp Leu Lys Arg Lys Cys 
145 150 155 160 

Glu Ala Gly Ala Thr Ser Ala He Thr Gin Phe Phe Phe Glu Ala Glu 
165 170 175 

Thr Phe Phe Arg Phe Arg Asp Ala Cys Val Lys Glu Gly He Thr Ala 
180 185 190 

Lys He He Pro Gly He Leu Pro He Gin Ser Trp Lys Gly Ala Lys 
195 200 205 

Ser Phe Ala Gin Arg Cys Gly Thr Ser He Pro Thr Trp Val Glu Glu 
210 215 220 

Ala Phe Asp His Ala He Arg Asp Asp Arg Glu Gin Leu Leu Ala Thr 
225 230 235 240 



a Leu Cys Thr Glu Leu Cys Asp Asn Leu He Ala Gly Gly Val Glu 
245 250 255 



sp Leu His Phe Tyr Thr Leu Asn Arg Pro Gin Met Thr Arg Asp Val 
260 265 270 

Cys His Ala Leu Gly Val Asn Pro Gly Val Val Leu Glu Asn Val Ala 
275 280 285 



<210> 45 

<211> 879 

<212> DNA 

<213> Neisseria meningitidis ser. A 

<220> 

<221> CDS 

<222> (1) . . (876) 

<223> RNM00812 
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<400> 45 

atg aat tac gca aaa gaa ate aat gcg tta aat aac age ctt tec gat 48 
Met Asn Tyr Ala Lys Glu lie Asn Ala Leu Asn Asn Ser Leu Ser Asp 
15 10 15 

ttg aaa ggc gac ate aac gtt teg ttt gaa ttt ttt cca ccg aaa aac 96 
Leu Lys Gly Asp lie Asn Val Ser Phe Glu Phe Phe Pro Pro Lys Asn 
20 25 30 

gag caa atg gaa acg atg ctg tgg gat tec ate cac cgt ctg caa ace 144 
Glu Gin Met Glu Thr Met Leu Trp Asp Ser lie His Arg Leu Gin Thr 
35 40 45 

ctg cat ccc aag ttc gta tec gta ace tac ggc gca aac tec ggc gaa 192 
Leu His Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu 
50 55 60 

cgc gac cgc acg cac ggc ate gtc aaa cgc ate aaa cag gaa acc ggc 240 
Arg Asp Arg Thr His Gly lie Val Lys Arg lie Lys Gin Glu Thr Gly 
65 70 75 80 




gaa gca gca ccg cac ctg acc ggc ate gac gca tec ccc gac gaa 2 88 

u Glu Ala Ala Pro His Leu Thr Gly lie Asp Ala Ser Pro Asp Glu 

85 90 ~ 95 

ttg cgc caa ate gee aaa gac tat tgg gac age ggc ate cgc cgc att 3 36 

Leu Arg Gin He Ala Lys Asp Tyr Trp Asp Ser Gly He Arg Arg He 

100 105 110 

gtc gee ctg cgt ggc gac gag ccg ccc ggt tat gag aaa aaa ccg ttt 3 84 
Val Ala Leu Arg Gly Asp Glu Pro Pro Gly Tyr Glu Lys Lys Pro Phe 

115 120 125 

tac gee gaa gac ttg gtt aag eta tta cgc tec gtc gee gac ttc gac 432 

Tyr Ala Glu Asp Leu Val Lys Leu Leu Arg Ser Val Ala Asp Phe Asp 

130 135 140 

ate tct gtg gcg gca tat ccc gaa gtg cat ccc gaa gee aaa tec gca 4 80 

lie Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys Ser Ala 

145 150 155 160 

aa gec gat ctg att aat ctg aag cgc aaa ate gat gcg ggt gca aac 528 

In Ala Asp Leu He Asn Leu Lys Arg Lys He Asp Ala Gly Ala Asn 

165 170 175 



cac gtc ate acc caa ttt ttc ttt gac gta gaa cgc tac ctg cgc ttc 
His Val He Thr Gin Phe Phe Phe Asp Val Glu Arg Tyr Leu Arg Phe 
180 185 190 



576 



cgc gac cgc tgc gtg atg ttg ggt ate gat gtg gaa ate gtc cct ggt 624 
Arg Asp Arg Cys Val Met Leu Gly He Asp Val Glu He Val Pro Gly 
195 200 205 

att ttg cct gtt acc aac ttc aag cag etc ggc aaa atg gcg caa gta 672 
He Leu Pro Val Thr Asn Phe Lys Gin Leu Gly Lys Met. Ala Gin Val 
210 215 220 

acc aac gtc aaa ate cca age tgg ctg teg caa atg tat gaa ggt ttg 720 
Thr Asn Val Lys He Pro Ser Trp Leu Ser Gin Met Tyr Glu Gly Leu 
225 230 235 ' 240 

gac gac gac caa ggc acg cgc aac etc gtc gee gee agt ate gee ate 768 
Asp Asp Asp Gin Gly Thr Arg Asn Leu Val Ala Ala Ser He Ala He 
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245 250 255 

gat atg gtc aaa gtc ctg tec cgc gaa ggc gtg aaa gat ttc cac ttc 816 
Asp Met Val Lys Val Leu Ser Arg Glu Gly Val Lys Asp Phe His Phe 
260 265 270 

tac acg etc aac cgc age gag ctg act tac gec ate tgc cat att tta 864 
Tyr Thr Leu Asn Arg Ser Glu Leu Thr Tyr Ala lie Cys His lie Leu 
275 280 285 

ggc gtg cgc cct taa 879 
Gly Val Arg Pro 
290 



<210> 46 
<211> 292 
<212> PRT 

<213> Neisseria meningitidis ser. A 
00> 46 

|t Asn Tyr Ala Lys Glu lie Asn Ala Leu Asn Asn Ser Leu Ser Asp 
15 10 15 

Leu Lys Gly Asp lie Asn Val Ser Phe Glu Phe Phe Pro Pro Lys Asn 
20 25 30 

Glu Gin Met Glu Thr Met Leu Trp Asp Ser He His Arg Leu Gin Thr 
35 40 45 

Leu His Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu 
50 55 60 

Arg Asp Arg Thr His Gly He Val Lys Arg He Lys Gin Glu Thr Gly 
65 70 75 80 

Leu Glu Ala Ala Pro His Leu Thr Gly He Asp Ala Ser Pro Asp Glu 
85 90 * 95 

Leu Arg Gin He Ala Lys Asp Tyr Trp Asp Ser Gly He Arg Arg He 
100 105 110 

! al Ala Leu Arg Gly Asp Glu Pro Pro Gly Tyr Glu Lys Lys Pro Phe 
115 120 125 

Tyr Ala Glu Asp Leu Val Lys Leu Leu Arg Ser Val Ala Asp Phe Asp 
130 135 140 

He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys Ser Ala 
145 150 155 160 

Gin Ala Asp Leu He Asn Leu Lys Arg Lys He Asp Ala Gly Ala Asn 
165 170 175 

His Val He Thr Gin Phe Phe Phe Asp Val Glu Arg Tyr Leu Arg Phe 
180 185 190 

Arg Asp Arg Cys Val Met Leu Gly He Asp Val Glu He Val Pro Gly 
195 200 205 

He Leu Pro Val Thr Asn Phe Lys Gin Leu Gly Lys Met Ala Gin Val 
210 215 220 
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Thr Asn Val Lys lie Pro Ser Trp Leu Ser Gin Met Tyr Glu Gly Leu 
225 230 235 240 

Asp Asp Asp Gin Gly Thr Arg Asn Leu Val Ala Ala Ser lie Ala lie 
245 250 255 

Asp Met Val Lys Val Leu Ser Arg Glu Gly Val Lys Asp Phe His Phe 
260 265 270 

Tyr Thr Leu Asn Arg Ser Glu Leu Thr Tyr Ala lie Cys His lie Leu 
275 280 285 

Gly Val Arg Pro 
290 



<210> 47 

<211> 849 

<212> DNA 

<213> Campylobacter jejuni 



• 



0> 
21> CDS 



<222> (1) . . (846) 
<223> RCJ02911 

<400> 47 

atg tgt agt ttt tct ttt gaa gtt ttt cca cca aga aag gat gaa aat 48 

Met Cys Ser Phe Ser Phe Glu Val Phe Pro Pro Arg Lys Asp Glu Asn 
1 5 10 15 

ate aaa aat ctt cat get ate tta gat gat tta ggg caa tta age cct 96 
lie Lys Asn Leu His Ala lie Leu Asp Asp Leu Gly Gin Leu Ser Pro 
20 25 30 

aat ttt ate age gta acc ttt gga get gga ggc tct att aac tea caa 144 
Asn Phe lie Ser Val Thr Phe Gly Ala Gly Gly Ser He Asn Ser Gin 
35 40 45 



^at act tta gaa gtt gca age tta ate cag gaa gaa tat caa att cct 192 
n Thr Leu Glu Val Ala Ser Leu He Gin Glu Glu Tyr Gin He Pro 
50 55 60 



age ata gta cat tta cct tgc ate cat tct agt aaa gaa aaa ate act 24 0 
Ser He Val His Leu Pro Cys He His Ser Ser Lys Glu Lys He Thr 
65 70 75 80 

cag ata ctt caa aaa tgc aaa gaa aaa aat ctt aat caa att ctt gee 28 8 
Gin He Leu Gin Lys Cys Lys Glu Lys Asn Leu Asn Gin He Leu Ala 
85 90 95 

eta aga ggc gat ata tgt gaa aat tta aaa aaa age aaa gat ttt tct 33 6 
Leu Arg Gly Asp He Cys Glu Asn Leu Lys Lys Ser Lys Asp Phe Ser 
100 105 110 

tat get agt gat tta att tct ttt ata aaa aaa caa gaa tac ttt gaa 3 84 
Tyr Ala Ser Asp Leu He Ser Phe He Lys Lys Gin Glu Tyr Phe Glu 
115 120 125 

att tat gec gca tgc tat ccc gaa aaa cat aat gaa tct aaa aat ttc 43 2 
He Tyr Ala Ala Cys Tyr Pro Glu Lys His Asn Glu Ser Lys Asn Phe 
130 135 140 
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ate gag gat ata cac cat ctt aaa act aag gta aat gca gga aca gat 480 
lie Glu Asp He His His Leu Lys Thr Lys Val Asn Ala Gly Thr Asp 
145 150 155 160 

aag etc att act caa ctt ttt tac gat aat gaa gat ttt tat act ttt 52 8 
Lys Leu He Thr Gin Leu Phe Tyr Asp Asn Glu Asp Phe Tyr Thr Phe 
165 170 175 

aaa caa aat tgt get tta gca gat att gac ata cct att tac gca ggt 576 
Lys Gin Asn Cys Ala Leu Ala Asp He Asp He Pro lie. Tyr Ala Gly 
180 185 ' " * ' . 190, 

att atg cct att act aac aaa aga cag gtt tta aaa att. tct caa ctt 624 
He Met Pro He Thr Asn Lys Arg Gin Val Leu Lys He Ser Gin Leu 
195 200 205 

tgc gga get aaa ate cct cct aaa ttt gtt aaa att tta gaa aaa tat 672 
Cys Gly Ala Lys He Pro Pro Lys Phe Val Lys He Leu Glu Lys Tyr 
210 215 220 



^^^^ 



aat aat act ttg get tta gaa gat gca ggt ate gcg tat get tgc 720 
Asn Asn Thr Leu Ala Leu Glu Asp Ala Gly He Ala Tyr Ala Cys 
5 230 235 " 240 




gat caa att gtc gat tta ate aca agt ggt gta gat gga/att cat ctt 768 
Asp Gin lie Val Asp Leu He Thr Ser Gly Val Asp Gly lie .His Leu 
245 250 255 

tat act atg aat aaa tec aaa gcg get att aaa att tat gaa get gta 816 
Tyr Thr Met Asn Lys Ser Lys Ala Ala He Lys He Tyr Glu Ala Val 
260 265 270 

aag cat ttg ctt aaa gaa gag ctt cat get tag 84 9 

Lys His Leu Leu Lys Glu Glu Leu His Ala 
275 280 

<210> 48 * , 

<211> 282 
<212> PRT 

13> Campylobacter jejuni 

F 400> 48 

Met Cys Ser Phe Ser Phe Glu Val Phe Pro Pro Arg Lys Asp Glu Asn 
1 5 10 15 

He Lys Asn Leu His Ala He Leu Asp Asp Leu Gly Gin Leu Ser Pro 
20 25 30 

Asn Phe He Ser Val Thr Phe Gly Ala Gly Gly Ser He Asn Ser Gin 
35 40 45 

Asn Thr Leu Glu Val Ala Ser Leu He Gin Glu Glu Tyr Gin He Pro 
50 55 .60 

Ser He Val His Leu Pro Cys He His Ser Ser Lys Glu Lys He Thr 
65 70 75 80 

Gin He Leu' Gin Lys Cys Lys Glu Lys Asn Leu Asn Gin lie Leu Ala 
85 90 95 

Leu Arg Gly Asp He Cys Glu Asn Leu Lys Lys Ser Lys Asp Phe Ser 
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100 105 110 

Tyr Ala Ser Asp Leu lie Ser Phe lie Lys Lys Gin Glu Tyr Phe Glu 

115 120 125 

He Tyr Ala Ala Cys Tyr Pro Glu Lys His Asn Glu Ser Lys Asn Phe 

130 13 5 140 

He Glu Asp He His His Leu Lys Thr Lys Val Asn Ala Gly Thr Asp 

145 150 155 " 160 

Lys Leu He Thr Gin Leu Phe Tyr Asp Asn Glu Asp Phe Tyr Thr Phe 

165 170 175 

Lys Gin Asn Cys Ala Leu Ala Asp He Asp He Pro He Tyr Ala Gly 

180 185 190 

He Met Pro He Thr Asn Lys Arg Gin Val Leu Lys He Ser Gin Leu 

195 200 205 

Cys Gly Ala Lys He Pro Pro Lys Phe Val Lys He Leu Glu Lys Tyr 

210 215 ~ 220 



Asn Asn Thr Leu Ala Leu Glu Asp Ala Gly He Ala Tyr Ala Cys 
5 230 235 * 240 

Asp Gin He Val Asp Leu lie Thr Ser Gly Val Asp Gly He His Leu 
245 250 255 

Tyr Thr Met Asn Lys Ser Lys Ala Ala He Lys He Tyr Glu Ala Val 
260 265 270 

Lys His Leu Leu Lys Glu Glu Leu His Ala 
275 280 



<210> 49 
<211> 852 
<212> DNA 

<213> Lactococcus lactis 



^3^22 



20> 

1> CDS 

2> (1) . . (849) 

23> AAK05352 



<400> 49 

afcg aca agt aat tec aaa att ctt tct ttt gaa gtt ttt cca cct aca 48 

Met Thr Ser Asn Ser Lys lie Leu Ser Phe Glu Val Phe Pro Pro Thr 
15 10 15 

act caa att gga agt acc aac ttg gta aag acc ttg gat age eta aga 96 

Thr Gin He Gly Ser Thr Asn Leu Val Lys Thr Leu Asp Ser Leu Arg 
20 25 30 

act etc teg cca gat ttt ate agt gta act tgt agt aac aat aat tat 144 

Ttir Leu Ser Pro Asp Phe He Ser Val Thr Cys Ser Asn Asn Asn Tyr 
35 40 45 

gat aat att gga gat aca act ata aag ttt get gat tat gta aac aat 192 

Asp Asn He Gly Asp Thr Thr He Lys Phe Ala Asp Tyr Val Asn Asn 
50 55 60 
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aca eta gat att cca gcg gtt get cat tta cct gec get tat tta gat 

Thr Leu Asp lie Pro Ala Val Ala His Leu Pro Ala Ala Tyr Leu Asp 

65 70 75 80 

aaa get caa gtg ate gaa att ttg gaa egg tta aaa gat aaa caa ate 

Lys Ala Gin Val lie Glu lie Leu Glu Arg Leu Lys Asp Lys Gin lie 

85 90 95 

aaa aaa att ctt get tta aga ggt gat ate age gat gaa ccg atg aaa 

Lys Lys He Leu Ala Leu Arg Gly Asp He Ser Asp Glu Pro Met Lys 

100 105 110 

gat gat ttt aaa ttt gca agt gat ttg gtt aaa ttt ate aaa gat tat 

Asp Asp Phe Lys Phe Ala Ser Asp Leu Val Lys Phe He Lys Asp Tyr 

115 120 125 

gat gat agt ttt gaa gtt tta ggt get tgc tac ccc gat att cat ccc 

Asp Asp Ser Phe Glu Val Leu Gly Ala Cys Tyr Pro Asp He His Pro 

13 0 135 140 

gaa tea gta aat cga gtg agt gat ttt cat tat ctg aaa gaa aaa gta 

Ser Val Asn Arg Val Ser Asp Phe His Tyr Leu Lys Glu Lys Val 

150 155 "* 160 




gat get ggt tgt gac aga tta ate acg caa eta ttt ttt gat aat gat 
Asp Ala Gly Cys Asp Arg Leu He Thr Gin Leu Phe Phe Asp Asn Asp 
165 170 * 175 

agt ttc tat gat ttt caa gaa cga tgc gca att get gag ata aat act 
Ser Phe Tyr Asp Phe Gin Glu Arg Cys Ala He Ala Glu He Asn Thr 
180 185 190 

ccg ata ttc gee gga ata atg cca gta ate aat cga aat caa att ctt 
Pro He Phe Ala Gly He Met Pro Val He Asn Arg Asn Gin He Leu 
195 200 ~ 205 

cgt eta tta aaa aat tgt aat acg cca tta cca gca aaa ttc att aga 
Arg Leu Leu Lys Asn Cys Asn Thr Pro Leu Pro Ala Lys Phe He Arg 
210 215 220 

ata etc gaa aaa tat gaa cat aat ctt ate get tta agg gat get gga 
^e Leu Glu Lys Tyr Glu His Asn Leu He Ala Leu Arg Asp Ala Gly 

230 235 ^ 240 



t get tac gee ate gat caa ate gtt gat tta gta aca gag gat gtt 
He Ala Tyr Ala He Asp Gin He Val Asp Leu Val Thr Glu Asp Val 
245 250 255 



get gga att cac etc tat acg atg 
Ala Gly He His Leu Tyr Thr Met 
260 

ate cat get tea att tct tct tta 
He His Ala Ser He Ser Ser Leu 
275 280 



aat aat gca aat acg gca cac tec 
Asn Asn Ala Asn Thr Ala His Ser 
265 270 

ttt ace ttt tga 
Phe Thr Phe 



<210> 50 
<211> 283 
<212> PRT 

<213> Lactococcus lactis. 
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288 



336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



852 
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<400> 50 

Met Thr Ser Asn Ser Lys lie Leu Ser Phe Glu Val Phe Pro Pro Thr 
15 10 15 

Thr Gin lie Gly Ser Thr Asn Leu Val Lys Thr Leu Asp Ser Leu Arg 
20 25 " 30 

Thr Leu Ser Pro Asp Phe He Ser Val Thr Cys Ser Asn Asn Asn Tyr 
35 40 45 

Asp Asn He Gly Asp Thr Thr He Lys Phe Ala Asp Tyr Val Asn Asn 
50 55 60 

Thr Leu Asp He Pro Ala Val Ala His Leu Pro Ala Ala Tyr Leu Asp 
65 70 75 80 

Lys Ala Gin Val He Glu He Leu Glu Arg Leu Lys Asp Lys Gin He 
85 90 95 

Lys Lys He Leu Ala Leu Arg Gly Asp He Ser Asp Glu Pro Met Lys 
100 105 110 

Asp Phe Lys Phe Ala Ser Asp Leu Val Lys Phe He Lys Asp Tyr 
115 120 125 

Asp Asp Ser Phe Glu Val Leu Gly Ala Cys Tyr Pro Asp He His Pro 
130 135 140 

Glu Ser Val Asn Arg Val Ser Asp Phe His Tyr Leu Lys Glu Lys Val 
145 150 155 160 

Asp Ala Gly Cys Asp Arg Leu He Thr Gin Leu Phe Phe Asp Asn Asp 
165 170 175 

Ser Phe Tyr Asp Phe Gin Glu Arg Cys Ala He Ala Glu He Asn Thr 
180 185 190 

Pro He Phe Ala Gly He Met Pro Val He Asn Arg Asn Gin He Leu 
195 200 205 

Arg Leu Leu Lys Asn Cys Asn Thr Pro Leu Pro Ala Lys Phe He Arg 
210 215 220 

Leu Glu Lys Tyr Glu His Asn Leu He Ala Leu Arg Asp Ala Gly 
230 235 240 

He Ala Tyr Ala He Asp Gin He Val Asp Leu Val Thr Glu Asp Val 
245 250 255 

Ala Gly He His Leu Tyr Thr Met Asn Asn Ala Asn Thr Ala His Ser 
260 265 270 

He His Ala Ser He Ser Ser Leu Phe Thr Phe 
275 280 




<210> 51 
<211> 891 
<212> DNA 

<213> Prochlorococcus tnaritima 

<220> 
<221> CDS 
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<222> (1) . . (888) 
<223> RCK01602 

<400> 51 

ttg aaa tea aaa ctt cag caa act tta gaa aag aat tea aaa gta att 48 

Leu Lys Ser Lys Leu Gin Gin Thr Leu Glu Lys Asn Ser Lys Val lie 
1 5 10 is 

aca gca gaa tta atg ccg cca aga gga gga gac ccc gta aga tct ctt 96 
Thr Ala Glu Leu Met Pro Pro Arg Gly Gly Asp Pro Val Arg Ser Leu 
20 25 30 



aaa ata gca caa etc ttg aga aat aag gtg cat gca gtt aat att aca 
Lys lie Ala Gin Leu Leu Arg Asn Lys Val His Ala Val Asn lie Thr 
35 40 45 




tta tta aaa caa att caa tea ttc aat caa gga att gat cct act ttt 
Leu Leu Lys Gin He Gin Ser Phe Asn Gin Gly He Asp Pro Thr Phe 
130 135 140 

gaa caa ctt cca gac aaa agg act gaa att ttc tea ggt gcg gca gta 
^ai Gin Leu Pro Asp Lys Arg Thr Glu He Phe Ser Gly Ala Ala Val 

150 155 160 



144 



gac gga agt aga gca ata atg aga atg tgt agt tta gca atg tct aaa 192 
Asp Gly Ser Arg Ala He Met Arg Met Cys Ser Leu Ala Met Ser Lys 
50 55 60 

c 5 a tta cta gac aat ggg ata gaa cct ata atg cag ate tea tgt aga 24 0 
^ Leu Leu Asp Asn Gly He Glu Pro He Met Gin He Ser Cys Arg 

70 75 " 80 

gat cgt aat aaa att get tta caa tea gat att ctt gga gca aat gee 288 
Asp Arg Asn Lys He Ala Leu Gin Ser Asp He Leu Gly Ala Asn Ala 
85 90 95 

tta gga att aaa aat att tta tgc att aca gga gat tct gta aaa gee 336 
Leu Gly He Lys Asn He Leu Cys He Thr Gly Asp Ser Val Lys Ala 
100 105 110 

gga gat cag caa gaa aca aaa gee gtt cat gaa ttt gag gca gta aga 384 
Gly Asp Gin Gin Glu Thr Lys Ala Val His Glu Phe Glu Ala Val Arg 
115 120 125 



432 



480 



t cca agt tgt cga aat caa aga agt tta aaa agt aga aca att aaa 528 
Asp Pro Ser Cys Arg Asn Gin Arg Ser Leu Lys Ser Arg Thr He Lys 
165 170 175 

aaa aaa gag gee ggt gca aat ttc tta caa act caa ata gtt atg gat 576 
Lys Lys Glu Ala Gly Ala Asn Phe Leu Gin Thr Gin He Val Met Asp 
180 185 190 

aga aaa tgt tta gca gac ttt tgc aac gaa ate agt aat cca ctt gag 624 
Arg Lys Cys Leu Ala Asp Phe Cys Asn Glu He Ser Asn Pro Leu Glu 
195 200 205 

ata cca gtt att gca gga gta ttt ctt tta aaa tea tat aaa aat get 672 
He Pro Val He Ala Gly Val Phe Leu Leu Lys Ser Tyr Lys Asn Ala 
210 215 220 

ctt ttc ata aat aaa ttt gta cct gga gcg aat att cct gaa aat gtt 720 
Leu Phe He Asn Lys Phe Val Pro Gly Ala Asn He Pro Glu Asn Val 
225 230 235 240 
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tta aat cgt etc aaa gat gca aaa aat cca ctt caa gaa gga ata tta 768 
Leu Asn Arg Leu Lys Asp Ala Lys Asn Pro Leu Gin Glu Gly lie Leu 
245 250 255 

att get tea gag caa get caa gat ttt att aat att gca gat gga att 816 
He Ala Ser Glu Gin Ala Gin Asp Phe He Asn He Ala Asp Gly He 
260 265 270 

cat ctt atg gca gtc aaa tea gaa cat ctt ate cca gag ata ctt gaa 864 
His Leu Met Ala Val Lys Ser Glu His Leu He Pro Glu He Leu Glu 
275 280 285 

aaa get ggt etc aat ctg gaa tgt taa 891 
Lys Ala Gly Leu Asn Leu Glu Cys 
290 295 



<210> 52 
<211> 296 
<212> PRT 

3> Prochlorococcus maritima 



9 

Leu 



> 52 

eu Lys Ser Lys Leu Gin Gin Thr Leu Glu Lys Asn Ser Lys Val He 
1 5 10 15 

Thr Ala Glu Leu Met Pro Pro Arg Gly Gly Asp Pro Val Arg Ser Leu 
20 25 30 

Lys He Ala Gin Leu Leu Arg Asn Lys Val His Ala Val Asn He Thr 
35 40 45 

Asp Gly Ser Arg Ala He Met Arg Met Cys Ser Leu Ala Met Ser Lys 
50 55 60 

Leu Leu Leu Asp Asn Gly He Glu Pro He Met Gin He Ser Cys Arg 
65 70 75 80 

Asp Arg Asn Lys He Ala Leu Gin Ser Asp He Leu Gly Ala Asn Ala 
85 90 95 

Gly He Lys Asn He Leu Cys He Thr Gly Asp Ser Val Lys Ala 
100 105 110 

Gly Asp Gin Gin Glu Thr Lys Ala Val His Glu Phe Glu Ala Val Arg 
115 120 ' 125 




Leu Leu Lys Gin He Gin Ser Phe 
130 135 

Glu Gin Leu Pro Asp Lys Arg Thr 
145 150 

Asp Pro Ser Cys Arg Asn Gin Arg 
165 

Lys Lys Glu Ala Gly Ala Asn Phe 
180 

Arg Lys Cys Leu Ala Asp Phe Cys 
195 200 
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Asn Gin Gly He Asp Pro Thr Phe 
140 

Glu He Phe Ser Gly Ala Ala Val 
155 160 

Ser Leu Lys Ser Arg Thr He Lys 
170 175 

Leu Gin Thr Gin He Val Met Asp 
185 190 

Asn Glu He Ser Asn Pro Leu Glu 
205 
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He Pro Val He Ala Gly Val Phe Leu Leu Lys Ser Tyr Lys Asn Ala 
210 215 220 

Leu Phe He Asn Lys Phe Val Pro Gly Ala Asn He Pro Glu Asn Val 
225 r 230 235 240 

Leu Asn Arg Leu Lys Asp Ala Lys Asn Pro Leu Gin Glu Gly He Leu 
245 250 " 255 

He Ala Ser Glu Gin Ala Gin Asp Phe He Asn He Ala Asp Gly He 
260 265 270 

His Leu Met Ala Val Lys Ser Glu His Leu He Pro Glu He Leu Glu 
275 280 285 

Lys Ala Gly Leu Asn Leu Glu Cys 
290 295 



<210> 53 

L> 1848 

|> DNA 

[> Bacillus stearothermophilus 

<220> 

<221> CDS 

<222> (1) . . (1845) 

<223> RBE04103 

<400> 53 

gtg gga ttg ctg gat gag ttg aaa gag cgc att etc ate gec gac ggg 48 
Val Gly Leu Leu Asp Glu Leu Lys Glu Arg He Leu He Ala Asp Gly 
1 5 10 15 

gcg atg gga acg ctt tta tat teg cac ggc att gac cgt tgt ttt gaa 96 
Ala Met Gly Thr Leu Leu Tyr Ser His Gly He Asp Arg Cys Phe Glu 
20 25 30 

gaa ttg aat eta tec aat cca gat gaa ate gtc cat att cat gaa gcg 144 
Glu Leu Asn Leu Ser Asn Pro Asp Glu He Val His He His Glu Ala 
35 40 45 




m 



ate gee gcg ggc gec gac gtc att cag acg aat aca tac ggc gee 192 
r He Ala Ala Gly Ala Asp Val He Gin Thr Asn Thr Tyr Gly Ala 
50 55 60 

aac tat gtg aaa etc gee cgc tac ggc ctt gaa gat gag gtg ccg gee 24 0 
Asn Tyr Val Lys Leu Ala Arg Tyr Gly Leu Glu Asp Glu Val Pro Ala 
65 70 75 80 

ate aac cgc gcg gcg gtg egg etc gec agg caa gcg gcg aac gga egg 288 
lie Asn Arg Ala Ala Val Arg Leu Ala Arg Gin Ala Ala Asn Gly Arg 
85 90 95 

gca tac gtg etc ggg acg ate ggg ggg ctg cgc acg tta aac aaa age 336 
Ala Tyr Val Leu Gly Thr He Gly Gly Leu Arg Thr Leu Asn Lys Ser 
100 105 110 

gtc gtc acg etc gaa gaa gtg aag egg acg ttt cgc gag cag ctg ttt 3 84 
Val Val Thr Leu Glu Glu Val Lys Arg Thr Phe Arg Glu Gin Leu Phe 
115 120 125 
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gtc ctg etc get gaa ggg gtc gac ggc gtg ctg etc gag acg tat tac 432 
Val Leu Leu Ala Glu Gly Val Asp Gly Val Leu Leu Glu Thr Tyr Tyr 
130 135 140 

gat ttg gaa gag ttg gag acg gtg ctt gec ate gee cgc aaa gag ace 480 
Asp Leu Glu Glu Leu Glu Thr Val Leu Ala lie Ala Arg Lys Glu Thr 
145 150 155 ~ ^ 160 

gac ttg ccg att ate get cac gtc teg etc cat gaa gtc ggc gtc ttg 528 
Asp Leu Pro lie lie Ala His Val Ser Leu His Glu Val Gly Val Leu 
165 170 175 

caa gat ggc acg ccg etc gcg gac gec ctt gec cgc eta gag gcg etc 576 
Gin Asp Gly Thr Pro Leu Ala Asp Ala Leu Ala Arg Leu Glu Ala Leu 
180 185 " 190 

ggg gee gat gtc gtc gga ctg aac tgt cgt etc ggt cca tat cat atg 624 
Gly Ala Asp Val Val Gly Leu Asn Cys Arg Leu Gly Pro Tyr His Met 
195 200 205 

ctt egg teg etc gag gaa gtg ccg ctg cca aat cga gcg ttt ttg teg 672 
Arg Ser Leu Glu Glu Val Pro Leu Pro Asn Arg Ala Phe Leu Ser 
210 215 220 




gcg tat ccg aac gee age ctt ccg gat tac cgc gat ggg egg ctt gtc 720 
Ala Tyr Pro Asn Ala Ser Leu Pro Asp Tyr Arg Asp Gly Arg Leu Val 
225 230 235 * 240 

tat gag acg aac get gaa tat ttc gag gaa acg gee aaa gcg ttc cgc 768 
Tyr Glu Thr Asn Ala Glu Tyr Phe Glu Glu Thr Ala Lys Ala Phe Arg 
245 250 255 

gac caa ggg gtg cgc ttg ate ggc ggg tgc tgc ggc acg acg ccg aaa 816 
Asp Gin Gly Val Arg Leu He Gly Gly Cys Cys Gly Thr Thr Pro Lys 
260 265 270 

cat ate gaa gcg atg gca aaa gcg etc tec gac cga acg ccg gtg acg 864 
His He Glu Ala Met Ala Lys Ala Leu Ser Asp Arg Thr Pro Val Thr 
275 280 285 

gaa aaa acg gtg aaa egg cgc gcg gtg tct gta tea gtg caa gcg gag 912 
nu Lys Thr Val Lys Arg Arg Ala Val Ser Val Ser Val Gin Ala Glu 
* 290 295 300 



^lu 



[g ccc gec cca tct ccc ctt ccc gag ctt gec cgc acg cac cgc teg 
Arg Pro Ala Pro Ser Pro Leu Pro Glu Leu Ala Arg Thr His Arg Ser 
305 310 315 320 



960 



gtc att gtg gag ctg gat ccg ccg aaa aaa ttg ggg att gac aag ttt 1008 
Val He Val Glu Leu Asp Pro Pro Lys Lys Leu Gly He Asp Lys Phe 
325 330 335 

ctt gee ggg gcg aaa gcg etc cat gac gec ggc ate gat gcg ctg acg 1056 

Leu Ala Gly Ala Lys Ale* Leu His Asp Ala Gly He Asp Ala Leu Thr 

340 345 350 

ttg gee gac aac teg etc gec acg ccg cgc ate age aac gee get gtc 1104 

Leu Ala Asp Asn Ser Leu Ala Thr Pro Arg He Ser Asn Ala Ala Val 
355 360 365 

gee acg ate ate aag gag caa etc ggc ate cgc ccg etc gtg cat att 1152 

Ala Thr He He Lys Glu Gin Leu Gly He Arg Pro Leu Val His He 
370 375 380 

M/43126 MetF 



• 70 • 



aca tgc cgc gat cgc aat ttg ate ggc ttg cag teg cat ttg atg ggc 12 00 
Thr Cys Arg Asp Arg Asn Leu lie Gly Leu Gin Ser His Leu Met Gly 
385 390 395 400 

ttg cat acg etc ggc ate acc gat gtg etc gec att acc ggc gac ccg 124 8 
Leu His Thr Leu Gly lie Thr Asp Val Leu Ala He Thr Gly Asp Pro 
405 410 415 

teg aaa ate ggc gat ttt cca ggg gca acg tec gtg tac gac tta tea 12 96 
Ser Lys He Gly Asp Phe Pro Gly Ala Thr Ser Val Tyr Asp Leu Ser 
420 425 430 

teg ttc gat ttg ate cgc ttg ate cgc cag ttt aac gaa ggg ctg teg 13 44 
Ser Phe Asp Leu He Arg Leu He Arg Gin Phe Asn Glu Gly Leu Ser 
435 440 445 

tac teg ggc aaa ccg ctt ggg caa aaa acg aac ttc teg ate ggc get 13 92 
Tyr Ser Gly Lys Pro Leu Gly Gin Lys Thr Asn Phe Ser He Gly Ala 
450 455 460 

ttc aac ccg aac gtc cgc cat ttg gac aaa gcg gtc gag egg atg 1440 
Phe Asn Pro Asn Val Arg His Leu Asp Lys Ala Val Glu Arg Met 
470 475 480 

gag aaa aaa ate caa tgc ggc gee cat tat ttc ttg acc cag ccg att 
Glu Lys Lys He Gin Cys Gly Ala His Tyr Phe Leu Thr Gin Pro He 
485 490 495 

tac teg gaa gag aaa ate gtt gaa gtg cac gaa gcg acc aag cat ctt 
Tyr Ser Glu Glu Lys He Val Glu Val His Glu Ala Thr Lys His Leu 
500 505 510 

gac acg ccg att tac ate ggc att atg ccg ctt gtg age gcg cgc aac 
Asp Thr Pro He Tyr He Gly He Met Pro Leu Val Ser Ala Arg Asn 
515 520 525 

gec gac ttt ttg cat cat gaa gtg ccg ggc att acg etc tct gac gag 
Ala Asp Phe Leu His His Glu Val Pro Gly He Thr Leu Ser Asp Glu 
530 535 540 




±t cgc gee cgc atg gee gee tgc age ggc gac ccg gtg caa gca gee 
^ Arg Ala Arg Met Ala Ala Cys Ser Gly Asp Pro Val Gin Ala Ala 

550 555 560 



1488 



1536 



1584 



1632 



1680 



aag gaa ggc ate get ate gec aaa teg etc att gac get gcg ttt gat 1728 
Lys Glu Gly He Ala He Ala Lys Ser Leu He Asp Ala Ala Phe Asp 
56 5 570 575 

ttg ttt aac ggc att tat ttg ate acg ccg ttc ttg cgc tac gac atg 1776 
Leu Phe Asn Gly He Tyr Leu He Thr Pro Phe Leu Arg Tyr Asp Met 
580 585 590 

^ 9 fr^ 2* 9 Ctt 9t ° C9C taC att cac *aa aaa gaa gcg gee gee aaa 1824 
Thr Val Glu Leu Val Arg Tyr He His Glu Lys Glu Ala Ala Ala Lys 
595 600 605 

gaa agg aag gtt gtt cat ggc taa 1848 
Glu Arg Lys Val Val His Gly 
610 615 

<210> 54 
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<211> 615 
<212> PRT 

<213> Bacillus stearothermophilus 
<400> 54 

Val Gly Leu Leu Asp Glu Leu Lys Glu Arg lie Leu lie Ala Asp Gly 
1 5 10 15 

Ala Met Gly Thr Leu Leu Tyr Ser His Gly lie Asp Arg Cys Phe Glu 
20 25 " ~ 30 



Glu Leu Asn Leu Ser Asn Pro Asp Glu lie Val His lie His Glu Ala 

35 40 45 

Tyr lie Ala Ala Gly Ala Asp Val lie Gin Thr Asn Thr Tyr Gly Ala 

50 55 60 

Asn Tyr Val Lys Leu Ala Arg Tyr Gly Leu Glu Asp Glu Val Pro Ala 

65 70 . 75 80 



Asn Arg Ala Ala Val Arg Leu Ala Arg Gin Ala Ala Asn Gly Arg 
85 90 95 



a Tyr Val Leu Gly Thr lie Gly Gly Leu Arg Thr Leu Asn Lys Ser 
100 105 110 

Val Val Thr Leu Glu Glu Val Lys Arg Thr Phe Arg Glu Gin Leu Phe 
115 120 125 

Val Leu Leu Ala Glu Gly Val Asp Gly Val Leu Leu Glu Thr Tyr Tyr 
13 0 135 140 

Asp Leu Glu Glu Leu Glu Thr Val Leu Ala lie Ala Arg Lys Glu Thr 
145 150 155 ^ 160 

Asp Leu Pro lie lie Ala His Val Ser Leu His Glu Val Gly Val Leu 
165 170 175 

Gin Asp Gly Thr Pro Leu Ala Asp Ala Leu Ala Arg Leu Glu Ala Leu 
180 185 190 

Ala Asp Val Val Gly Leu Asn Cys Arg Leu Gly Pro Tyr His Met 
195 200 205 

Leu Arg Ser Leu Glu Glu Val Pro Leu Pro Asn Arg Ala Phe Leu Ser 
210 215 220 

Ala Tyr Pro Asn Ala Ser Leu Pro Asp Tyr Arg Asp Gly Arg Leu Val 
225 230 235 ~ 240 

Tyr Glu Thr Asn Ala Glu Tyr Phe Glu Glu Thr Ala Lys Ala Phe Arg 
245 250 255 

Asp Gin Gly Val Arg Leu lie Gly Gly Cys Cys Gly Thr Thr Pro Lys 
260 265 270 

His lie Glu Ala Met Ala Lys Ala Leu Ser Asp Arg Thr Pro Val Thr 
275 280 285 

Glu Lys Thr Val Lys Arg Arg Ala Val Ser Val Ser Val Gin Ala Glu 
290 295 300 
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Arg Pro Ala Pro Ser Pro Leu Pro Glu Leu Ala Arg Thr His Arg Ser 
305 310 315 320 

Val lie Val Glu Leu Asp Pro Pro Lys Lys Leu Gly He Asp Lys Phe 
325 330 335 

Leu Ala Gly Ala Lys Ala Leu His Asp Ala Gly He Asp Ala Leu Thr 
340 345 350 

Leu Ala Asp Asn Ser Leu Ala Thr Pro Arg He Ser Asn Ala Ala Val 
355 360 365 

Ala Thr He He Lys Glu Gin Leu Gly He Arg Pro Leu Val His He 
370 375 380 

Thr Cys Arg Asp Arg Asn Leu He Gly Leu Gin Ser His Leu Met Gly 
385 390 395 400 

Leu His Thr Leu Gly He Thr Asp Val Leu Ala He Thr Gly Asp Pro 
405 410 415 




Lys He Gly Asp Phe Pro Gly Ala Thr Ser Val Tyr Asp Leu Ser 
420 425 430 



Ser Phe Asp Leu He Arg Leu He Arg Gin Phe Asn Glu Gly Leu Ser 
435 440 445 



Tyr Ser Gly Lys Pro Leu Gly Gin Lys Thr Asn Phe Ser lie Gly Ala 
450 455 460 

Ala Phe Asn Pro Asn Val Arg His Leu Asp Lys Ala Val Glu Arg Met 
465 470 ' 475 480 

Glu Lys Lys He Gin Cys Gly Ala His Tyr Phe Leu Thr Gin Pro He 
485 490 495 

Tyr Ser Glu Glu Lys lie Val Glu Val His Glu Ala Thr Lys His Leu 
500 505 510 

Asp Thr Pro He Tyr He Gly He Met Pro Leu Val Ser Ala Arg Asn 
515 . 520 525 

Asp Phe Leu His His Glu Val Pro Gly lie Thr Leu Ser Asp Glu 
530 535 540 

He Arg Ala Arg Met Ala Ala Cys Ser Gly Asp Pro Val Gin Ala Ala 
545 550 555 560 

Lys Glu Gly He Ala He Ala Lys Ser Leu He Asp Ala Ala Phe Asp 
565 570 575 

Leu Phe Asn Gly He Tyr Leu lie Thr Pro Phe Leu Arg Tyr Asp Met 
580 585 590 

Thr Val Glu Leu Val Arg Tyr He His Glu Lys Glu Ala Ala Ala Lys 
595 600 60S 




Glu Arg Lys Val Val His Gly 
610 615 



<210> 55 
<211> 52 
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<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 55 

cccgggatcc gctagcggcg cgccggccgg cccggtgtga aataccgcac ag 

<210> 56 
<211> 53 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 56 

tctagactcg agcggccgcg gccggccttt aaattgaaga cgaaagggcc teg 



<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 57 

gagatctaga cccggggatc cgctagcggg ctgetaaagg aagcgga 

<210> 58 
<211> 38 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz :PCR primer 
^0> 58 

JjWaggcgcg ccgctagcgt gggcgaagaa ctccagca 

<210> 59 
<211> 34 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz : PCR primer 
<400> 59 

gagagggegg ccgcgcaaag tcccgcttcg tgaa 

<210> 60 
<211> 34 
<212> DNA 

<213> Kiinstliche Sequenz 




Im> 57 
PL> 47 

12 > DNA 
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<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 60 

gagagggcgg ccgctcaagt cggtcaagcc acgc 34 

<210> 61 
<211> 140 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz:PCR primer 
<400> 61 

tcgaatttaa atctcgagag gcctgacgtc gggcccggta ccacgcgtca tatgactagt 60 
tcggacctag ggatatcgtc gacatcgatg ctcttctgcg ttaattaaca attgggatcc 120 
tctagacccg ggatttaaat 140 



^^p> 62 

m m> 140 

^ W 2> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen SequenzrPCR primer 
<400> 62 

gatcatttaa atcccgggtc tagaggatcc caattgttaa ttaacgcaga agagcatcga 60 
tgtcgacgat atccctaggt ccgaactagt catatgacgc gtggtaccgg gcccgacgtc 120 
aggcctctcg agatttaaat 140 



<210> 63 
<211> 33 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

23> Beschreibung der kunstlichen SequenzrPCR primer 



# 



0> 63 

gagcggcc gccgatcctt tttaacccat cac 33 



<210> 64 
<211> 32 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen SequenzrPCR primer 
<400> 64 

aggagcggcc gccatcggca ttttcttttg eg 32 



<210> 65 
<211> 5091 
<212> DNA 

<213> Kiinstliche Sequenz 
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<220> 

<223> Beschreibung der kxinstlichen Sequenz : Plasmid 
<400> 65 



gccgcgactg ccttcgcgaa gccttgcccc gcggaaattt cctccaccga gttcgtgcac 60 
acccctatgc caagcttctt tcaccctaaa ttcgagagat tggattctla ccgtggLat 120 
tcttcgcaaa aatcgtcccc tgatcgccct tgcgacgttg gcgtcggtgc cg?tggttgc 180 
gcttggcttg accgacttga tcagcggccg ctcgatttaa atctcglgL alctScgfc Ho 
gggcccggta ccacgcgtca tatgactagt tcggacctag ggatatcgt^ gacatcgatg 3 00 
TJZl** 9 ttaattaaca attgggatcc tctagacccg ggatttaaat cgctagcggl 360 
ctgctaaagg aagcggaaca cgtagaaagc cagtccgcag aaacggtqct oaccccaaat 4?o 
gaatgtcagc tactgggcta tctggacaag ggaaaacgca agcgcaaaga £aagcaggt 111 
agcttgcagt gggcttacat ggcgatagct agactgggcg gtt?tatgga LgcaagS 540 
«22Si? ^ a9Ct "" C9ccctct 99 taaggttggg aagccctgL aagtaaacfg loo 
gatggctttc ttgccgccaa ggatctgatg gcgcagggga tcaagatctg atcaagagac 660 
aggatgagga tcgtttcgca tgattgaaca agatggattg cacgcaggt? ctccg^ccgc 720 
ttgggtggag aggctattcg gctatgactg ggcacaacag acaatcigct gctc?Iat£ 7B0 
cgccgtgttc cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ?cgac?tgtc 840 
cggtgccctg aatgaactgc aggacgaggc agcgcggcta tcg?ggctgg ccacgacggg 900 
^ gcagctgtgc tcgacgttgt cactgaagcg ggaaggac? ggctgctf?? 960 
^ 9 o" Ca " atctcct 9 tc atctcacctt gctcctgccg agaaagtatc 1020 
m *atggct gatgcaatgc ggoggctgca tacgcttgat ccggctacct gcccattcga 1080 
^RaT^all ^ a r tC9Ca tC ^ C ^° acgtactcgg atggaagccg gtcttgtc^a lllo 
Tcaggatgat ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct 1200 
caaggcgcgc atgcccgacg gcgaggatct cgtcgtgacc catggcgatg cc?gctScc 1260 
gaatatcatg gtggaaaatg gccgcttttc tggattcatc gac^gtggcc ggctgggtgt llto 
. ggcggaccgc tatcaggaca tagcgttggc tacccgtgat attgctglag Sct?Igcgg lllo 
cgaatgggct gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcaqScat 1440 
cgccttctat cgccttcttg acgagttctt ctlagcgjga ctctgg^g" cgaaat|acc JsoS 
Ia^ aa9C9a ^ 9CCCaacct 9cc.tc.cg. gatttcgatt ccacSIcgc c?tcta?gaa 156? 
aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggglat 1620 
ctcatgctgg agttcttcgc ccacgctagc ggcgcgcogg ccggcccggt gtgaalflcc 1680 
gcacagatgc gtaaggagaa aataccgcat caggcgctc? tccgcttSt cgSactga 
acaattS ^" tC f tc ^tgcggcg agcggtatca gctcactcaa Sgcggtaat lloo 
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggc^agca I860 
to 39 ! 00399 aac ° 9taaaa -93ccgcgtt gctggcgttt ttccataggc tcc^ccc?" llto 
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata lllo 
aagataccag gcgtttcccc ctggaagotc cctcgtgcgc tctcctgtL cglccctScc lllo 
IclltJ 99 * t a t C t 9tCCg cctttctccc ttcgggaagc gtggcgcttt c?catagctc 2100 
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgScga lllo 
^fcccccgtt cagcccgacc gctgcgcott atccggtaac ta?cg?c?tg Iglccaaccc 2220 
^Bjaagacac gacttatcgc cactggcagc agccactggt aaca^gatt! g^agagcgag lllo 
■MKtgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactaaaaa llln 
ztllltlT " tatCt9C9 -tctgctgaa gcclg??acc ttcggaaaaa gagttg|tag lllo 
Uttt 9 " Caaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagclgca 246^ 

llltn 9 t 9C agaaaaaaa 9 gatctcaaga agatcctttg atcttttcta cggggtcfga lllo 
c?tcacctaa ^Sf cac 9 ttaa 99 gattttggtc atgagattat cSaaaggK 2SS0 
cttcacctag atccttttaa aggccggccg cggccgcgca aagtcccgct tcgtgaaaat 2640 
lltlft 9CC9 C3t9attttc cgccaaaaac tttaacgaac gtfcgttata atSgtcat 2100 
gaccttcacg acgaagtact aaaattggcc cgaatcatca gctatggatc tc?ctXtat lllo 
cgcgctggag tccgacgcgc tcgatgctgc cgtogattta aaaacIXga tcggaftSt lllo 
ccgagctctc gatacgacgg acgcgccagc a?cacgagac tgggcXgtg" ccgSgcga lllo 
occaao 3 rt***™ atcttgagga gctggctlac glgctgcltl ctcggccagc lllo 
gccaggagga cgcacagtag tggaggatgc aatcagttgc gcctactgcg gtggcctglt 3000 
2eS°S CCt9aCCC9C ^acggcg cgcaalatat ?gctcagatg cg?gtcg?gc 3^60 
cgcagccagc cgcgagcgcg ccaacaaacg ccacgccgag gagctggagg cggctaSaK lllo 
gcaaatggcg ctggaagtgc gtcccccgag cgaaatt?tg gccatStcJ tcacagSct lllo 
ggaagcggca gcgagaatta tcgcgatcgt ggcggtgcc? gcaggStgl caaacaSgt lllo 
aaatgccgcg tttcgtgtgc cgtggccgcc caggacgtgt cagclccgcc accacc^gca 33o2 

gcSgSac ^gaaalatg ^l? 9 *** gcggcaa^aa gcgataa^t 3360 

gcacgaatac ctgaaaaatg ttgaacgccc cgtgagcggt aactcacaqq qcatcaoctp 7A5n 
acccccagtc caaacctggg agaaagcgct caaaaatgc tctagcgga? ?cacgaSca 34B0 
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ttgacacacc ggcctggaaa ttttccgctg 
tgcgatcacg tggctggacg agcgaagacc 
aaaatttcca gggcagcaag acccgcgact 
cggagaaaca cagccgaagt tataccgagt 
tgttgctctg acgcacgcgc agcacgcagc 
ccaccaggcc ggcgggaaaa tcgagcacgt 
ctgggcacgc ctggaaaaag cgccagcttg 
ccagctcatc tggctcattg atccggtgta 
gcgcctgctg gctgcaacga ccgaggaaat 
ttcacatagg ctgagccgtg gccactgcac 
tgcccagcac aatcgcgtgg atcgcctagc 
aggcacagaa aaacctaaaa aacgctatga 
cgaagcggca agaaaagcca ctgcggaagc 
gccgagcgcc gctgaagcgt ctggagagct 
tccagggcgt gccgcccgtg atgagacggc 
gttaaaagcg gctggtgagc gcctaaaaga 
ctacaccgtc gctcaggcgg tcggaggagg 
ccgccagacg gattggccgc gacgtgtgcg 
ccctgctcgt cagacagaga cgcagagcca 
aagacgtggc ggtaaaaagg ccgcagaacg 
ag cacagcga gaaaaactag ctaagtccag 
^fcocttgacc attgcaggtt ggtttatgac 
prmaatgaa gctatgtctg aatttagcgt 
^^Jbtgcggg cattgaactt ccacgaggac 
cgtaggcaga aaacggttcc cccgtagggt 
tgattgctct tgaagctctc taggggggct 
gctcgcctcg taagcgcaca aggactgctc 
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atctgttcga cacccatccc gagctcgcgc 3540 
gccgcgaatt cctcgctcac ctgggcagag 3600 
tcgccagcgc ttggatcaaa gacccggaca 3660 
tggttcaaaa tcgcttgccc ggtgccagta 3720 
cgtgcttgtc ctggacattg atgtgccgag 3780 
aaaccccgag gtctacgcga ttttggagcg 3840 
gatcggcgtg aatccactga gcgggaaatg 3900 
tgccgcagca ggcatgagca gcccgaatat 3960 
gacccgcgtt ttcggcgctg accaggcttt 4020 
tctccgacga tcccagccgt accgctggca 4 0 80 
tgatcttatg gaggttgctc gcatgatctc 4140 
gcaggagttt tctagcggac gggcacgtat 4200 
aaaagcactt gccacgcttg aagcaagcct 4260 
gatcgacggc gtccgtgtcc tctggactgc 4320 
ttttcgccac gctttgactg tgggatacca 4380 
caccaagggt catcgagcct acgagcgtgc 4440 
ccgtgagcct gatctgccgc cggactgtga 4500 
cggctacgtc gctaaaggcc agccagtcgt 4560 
gccgaggcga aaagctctgg ccactatggg 4620 
ctggaaagac ccaaacagtg agtacgcccg 4680 
tcaacgacaa gctaggaaag ctaaaggaaa 4740 
tgttgaggga gagactggct cgtggccgac 4800 
gtcacgtcag accgtgaata gagcacttaa 4860 
gccgaaagct tcccagtaaa tgtgccatct 492 0 
ctctctcttg gcctcctttc taggtcgggc 4980 
cacaccatag gcagataacg ttccccaccg 5 04 0 
ccaaagatct tcaaagccac t 5091 
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t2££? 9CS ^?? ttgtC ^ cct ^ctg tagttgcctt catcgatgaa ctgctgtaca 60 
i a aCg tttttccgtc acc 9tcaaag attgatttat aatcStctac accgt?gatg So 

^^aaagagc tgtctgatgc tgatacgtta acttgtgcag ttgtcagtgt ttgSSScS ^80 
9 t° C9gagaaatc agtgtagaat aaacggattt ttccgtcaga tSaaaJata III 
^RSrtS? accattcttg tgtttggtct tttaggatag aatcattt^c Scgaat^tg 300 
TSta^f taaagacgcg gccagcgttt ttccagctgt caatagaa^t ttcgccgac? 360 
ttttgataga acatgtaaat cgatgtgtca tecgcatttt taggatctcc ggetSSca 420 

3S SSSi SEF sssx ~S 

a =>= = ^=^r cccccctgtt tgaagatggc aagttagtta cgcacaataa aaaaaaacct 84 0 
StSctt?at c!a??^ aCg CCaaa 9 fcata cactttgccc t?tacacatt ttagg?cttg 900 
" S" cagtaacaaa cccgogcgat ttacttttcg acctcattct attagactc? 960 
E££Z£t 9 ° aaC ! ggtC tattttcetc ttttgtttga tagaaaatca taaaaggat? 1020 
t?taf a£tt S£7 aactaaaaaa tctatctgtt tcttttcatt ctctgK^t loll 
*"*^" fc c t9t fc 9catg ggcataaagt tgccttttta atcacaattc agaaaatatc 1140 

a^ggSggcc ESSSE iTcl^aT tatgtgatgg g^aataagg lltl 

ataJoaS llllllltt aat ^3^ ggcctgacgt cgggcccggt accacgcgtc 12 60 
atatgactag ttcggaccta gggatatcgt cgacatcgat gctcttctgc gttaattaac 1320 
aattgggatc ctctagaccc gggatttaaa tcgctagcgg gctgctaaSg gaagcSaac 1380 
aogtagaaag ccagtccgca gaaacggtgc tgaccccggl fgaatgtcag 1440 
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atctggacaa gggaaaacgc aagcgcaaag agaaagcagg tagcttgcag tgggcttaca 1500 
tggcgatagc tagactgggc ggttttatgg acagcaagcg aaccggaatt gccagctggg 1560 
gcgccctctg gtaaggttgg gaagccctgc aaagtaaact ggatggcttt cttgccgcca 1620 
aggatctgat ggcgcagggg atcaagatct gatcaagaga caggatgagg atcgtttcgc 1680 
atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 1740 
ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 1800 
gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 1860 
caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 1920 
ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 1980 
gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 2040 
cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 2100 
atcgagcgag cacgtactcg gatggaagcc ggtct-tgtcg atcaggatga tctggacgaa 2160 
gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac 2220 
ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 2280 
ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 2340 
atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 2400 
ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 2460 
gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg acgcccaacc 2520 
tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 2580 
ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 2640 
ccc acgctag cggcgcgccg gccggcccgg tgtgaaatac cgcacagatg cgtaaggaga 2700 
^^accgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 2760 
■itgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 2820 
fgataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 2880 
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 2940 
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 3000 
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 3060 
gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 3120 
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 3180 
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 3240 
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 3300 
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 3360 
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 3420 
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 3480 
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 3540 
tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 3600 
aaggccggcc gcggccgcca tcggcatttt cttttgcgtt tttatttgtt aactgttaat 3660 
tgtccttgtt caaggatgct gtctttgaca acagatgttt tcttgccttt gatgttcagc 3720 
aggaagctcg gcgcaaacgt tgattgtttg tctgcgtaga atcctctgtt tgtcatatag 3780 
cttgtaatca cgacattgtt tcbtttcgct tgaggtacag cgaagtgtga gtaagtaaag 3 84 0 
gttacatcgt taggatcaag atccattttt aacacaaggc cagttttgtt cagcggcttg 3 900 

ftgggccag ttaaagaatt agaaacataa ccaagcatgt aaatatcgtt agacgtaatg 3 960 
Iftcaatcg tcatttttga tccgcgggag tcagtgaaca ggtaccattt gccgttcatt 4 020 
Baagacgt tcgcgcgttc aatttcatct gttactgtgt tagatgcaat cagcggtttc 4 080 
cacttttt tcagtgtgta atcatcgttt agctcaatca taccgagagc gccgtttgct 4140 
aactcagccg tgcgtttttt atcgctttgc agaagttttt gactttcttg acggaagaat 4200 
gatgtgcttt tgccatagta tgctttgtta aataaagatt cttcgccttg gtagccatct 4260 
tcagttccag tgtttgcttc aaatactaag tatttgtggc ctttatcttc tacgtagtga 4320 

~ 4323 
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